Bot News

De Furilo
Ir a la navegación Ir a la búsqueda

¿Y si un periódico fuese una gran base de datos semántica sobre sucesos, lugares, personas, entidades...?

La estructura clásica y básica de una noticia sobre un suceso es contestar las 5 preguntas: qué, quién, cómo, cuándo y dónde. En muchos casos estas preguntas se pueden contestar de forma programática, y el que un periodista desarrolle un texto para contestarlas no aporta ningún valor. ¿Qué pasaría si una noticia no fuese escrita por una persona, y simplemente una máquina rellenase estos campos?

Ejemplos

Para una noticia como Activo un incendio en Ponteareas en el que resultó herido un motobombista, surge más de una noticia (o tenemos varias entidades en el suceso sobre los que se pueden contestar preguntas): por un lado el incendio en si mismo, y por otro que una persona ha resultado herida cuando participaba en su extinción. Si analizamos las 5 preguntas del primer suceso (el incendio), tendríamos algo como:

  • Qué: Incencio Forestal
  • Quién (o qué ha causado el incencio): ??
  • Cómo (se ha producido el incencio): ??
  • Cuándo: el incendio comenzó a las 19.24 del ¿25 jun 2013?
  • Dónde: se deberían ofrecer las coordenadas (la noticia solo informa de que ha sido en Padrons)

Además, se podrían asignar algunos metadatos:

  • Fuente: Consellería do Medio Rural e do Mar

En este ejemplo vemos que el autor del texto ni siquiera ha contestado a las preguntas básicas, y nos ofrece un texto con una longitud bastante larga respecto a la cantidad de información que ofrece.

También resulta natural que cada pregunta esté contestada por varios nodos - en el caso del "Qué", es obvio preguntarse por determinados atributos del "Incencio forestal": la extensión, qué había en la superficie quemada, ...; en el caso del "Cuándo", la fecha de inicio y de fin; en el caso del "Dónde", no solo unas coordenadas si no el área (que estaría relacionado con la extensión del "Qué")... Esto lleva a pensar en una estructura de outline o nodos de bases de datos documentales, como MongoDB, donde cada nodo puede tener los hijos que necesite sin que tenga que existir una estructura de campos predefinida.

Referencias