Descriptores

Teoría

Cuando hablamos de descriptores tenemos que hablar primeramente de tesauros. Veamos que dice wikipedia del significado de tesauro

“La palabra tesauro, derivado del neo latín que significa tesoro, se refiere a listado de palabras o términos empleados para representar conceptos. El termino proviene del latín thesaurus, el cual tiene su origen del griego clásico θησαυρός (thesauros), almacén, tesorería.”

“Adquiere al menos dos significados relacionados, el primero en el campo de la Literatura, el segundo en el campo de la Bibliotecología o Ciencias de la Información.”

“En el campo de la Bibliotecología o de las Ciencias de la Información, un tesauro es una lista que contiene los “términos” empleados para representar los conceptos, temas o contenidos de los documentos, con miras a efectuar una normalización terminólogica que permita mejorar el canal de acceso y comunicación entre los usuarios y las Unidades de Información (Entiéndase Unidad de Información como: Biblioteca, Archivo o Centros de Documentación). Aunque en la práctica tradicional se habla de Uniterminos, en la actualidad se ha efectuado grandes variaciones dando incorporación a terminos o descriptores compuestos, es decir, descriptores que se componen de 2 o más palabras. ”

“En líneas generales, un tesauro comprende lo siguiente:”

  1. Un listado de términos preferidos, que se los ordena en forma alfabética, temática y jerárquicamente.
  2. Un listado de sinónimos de esos términos preferidos, llamados descriptores, con la leyenda “úsese (término preferido)” o una indicación similar.
  3. Una jerarquía o relaciones entre los términos. Esto se expresa con la identificación de “términos más generales” y “términos más restringidos”.
  4. Las definiciones de los términos, para facilitar la selección de los mismos por parte del usuario
  5. Y un conjunto de reglas para usar el tesauro.

“Un descriptor es cada uno de los términos o expresiones escogidos entre un conjunto de sinónimos o cuasi sinónimos para representar (en calidad de término preferido) generalmente de manera unívoca, un concepto susceptible de aparecer con cierta frecuencia en los documentos indizables, y en las consultas que se realicen. El descriptor corresponde normalmente a la etiqueta de un concepto, y es la unidad mínima de significado que integra un tesauro o una lista de descriptores. Suele acompañarse de una nota de alcance o, menos usualmente, de una definición en los casos que el mero registro del término puede provocar problemas de ambigüedad en su interpretación. El descriptor es el término por el cual efectivamente se indizará (por eso se llama también término de indización), y por el cual se recuperarán los documentos referidos a su temática.”

Dicho de manera más simple, un descriptor es una palabra o composición de palabras que define el contenido de un documento.

Los diarios

En nuestro caso los diarios, usando una mirada sistemática podemos decir que los diarios son un conjunto de noticias y que a su vez esas noticias podemos conformarlas por descriptores, para su indización en la base de datos.

Diagrama1

Las ventajas de usar descriptores para la base de datos, en vez de texto completo o resumen, son varias, pero en lineas generales, se obtiene un mejor resultado de búsqueda ya que se eligen las palabras que representen mejor al documento. Se obtiene un índice de palabras que contiene la base de datos, que luego puede ser ordenada para el usuario. Para hacerlo más simple clasificamos a los descriptores en categorías generales. Nombrando a las categorías generales como categorías y a los descriptores como subcategorías.

Veamos un ejemplo. Supongamos que tenemos los siguientes descriptores conformado por categoria, subcategoria:

  • Sociedad, Fotografía
  • Sociedad, Baile
  • Local, Guadalupe
  • Lugar, Rambla López

Interpretamos que hay fotografías en la noticia, que es una noticia social, de un baile en Guadalupe en el lugar preciso de la “Rambla López”.

Otra ventaja que se obtiene, es la de obtener un márgen de error en carga más pequeño. Primero de todos porque se obliga al cargador a pensar cuál es el término que se deberá usar para representar la noticia. Además debe constatar que dicha palabra no se encuentre ya cargada de otra forma similar, y así evitar ambiguedades. Segundo se puede corregir de manera muy fácil el error cometido y afectará a todos los registros cargados, y no deberá preocuparse si cometió errores en otros registros.

Categoría Soft

Categorías desplegadas por el programa.

Categorías Internet

Categorías desplegadas en la página.

Al final del trabajo quedará conformada una base de datos de los diarios, y otra con los descriptores usados (tesauro), la cual podrá ser reutilizada para otras base datos. De esta forma podremos consultar por ejemplo las personas que aparecen en los diarios, los lugares, etc.

abajo