Cabecera de Ccinfo
 

Minería de datos

Lic. Marcelo de la Puente

Lo peor que nos puede pasar no es no tener información, sino, tener mucha y no saber que hacer con ella. Entendemos que la información es la clave que genera la ventaja competitiva, la cual se caracteriza por la toma de decisiones inteligentes en un entorno tan cambiable como en el que vivimos.

La minería de datos o Data Mining consiste en la extracción de información que reside de forma implícita en los datos. Se trata de información desconocida pero que puede resultar útil para efectuar algún proceso. Por lo tanto, la minería de datos se ocupa de recabar, extraer, sondear, preparar y explorar los datos para sacar toda la información que ocultan.

En los últimos años ha crecido nuestra capacidad de generar y colectar datos, debido al poder de procesamiento de las máquinas y al bajo costo de almacenamiento. En esta gran masa de datos, siempre podemos llegar a descubrir información oculta, que puede resultar de importancia estratégica para una empresa o particular, y a la que no se puede acceder por las técnicas clásicas de recuperación de datos. Sin embargo, las técnicas de Cata mining permiten hallarlos, gracias a la aplicación de la inteligencia artificial para encontrar patrones y relaciones dentro de los datos, lo que nos permite crear un modelo, o representaciones abstractas de la realidad, los cuales después de ser interpretados nos permiten obtener nuevo conocimiento.

El valor de estos datos, entonces, reside, en la información que se puede extraer de ellos y que ayude a tomar decisiones o a tomar comprensión de los fenómenos que nos rodean.

Podemos decir que de forma general son la materia prima bruta y cuando los usuarios les dan algún significado especial se convierten en información.

Como bibliotecarios, la minería de datos conforma una actividad que media entre la informática, la estadística y la documentación. En las bibliotecas, si bien es muy aplicable casi no se la emplea.

A nosotros nos resultaría muy útil su práctica para:

  • La selección y adquisición de datos, de modo que se puede definir los datos que se quieren recopilar y el método que se utilizará.
  • La preparación y el proceso de datos.
  • La interpretación e integración de los resultados.

La aplicación del Data Mining en nuestra área se denomina Bibliominería o Bibliomining y se la puede definir como la combinación de minería de datos, bibliometría, estadística y herramientas de elaboración de informes y extracción de patrones de comportamiento, basados en sistemas bibliotecarios.

Esta actividad en realidad se realiza desde principios de la década del 90 y suele implementarse mediante una serie de pasos:

  • Determinación de las áreas de interés.
  • Identificación de fuentes de datos internas y externas.
  • Recopilar, limpiar y hacer anónimos los datos en el data warehouse (almacén de datos).
  • Selección de las herramientas de análisis apropiadas.
  • Descubrimiento de patrones a través de la minería de datos y creación de informes con herramientas tradicionales de análisis.
  • Análisis e implementación de los resultados.

La aplicación de esta técnica en bibliotecas es realmente múltiple, ya que entre otras cosas permite:

  • Optimización de servicios: ayuda a los administradores a reorganizar el contenido de la biblioteca, autoridades e interfaces.
  • Apoyo a la toma de decisiones.
  • Personalización: ayuda a los usuarios a identificar información de interés para ellos por recomendación de materias similares. Lo que supondría una mejora de los tan útiles sistemas de DSI (Difusión Selectiva de Información).

Como afirma Jorge Candás Romero:

“Con el aumento de información disponible y la mejora de servicios que se pueden obtener de la bibliominería, en primer lugar se debe romper con la idea de que el usuario vaya a la biblioteca a buscar un libro concreto para después irse. Hay que potenciar la biblioteca como un lugar rico, abierto y completo donde descubrir y ampliar sus ideas y gustos”.

Podemos decir, para finalizar, que la bibliominería es un campo muy rico y complejo y que aún no ha sido del todo explorado y desarrollado por las Unidades de Información.

Consultora de Ciencias de la Información © 2009 - 2010