Diferencia entre revisiones de «DBpedia»

(Etiqueta: revisar proyecto)
(Etiqueta: revisar proyecto)
Línea 24: Línea 24:
 
}}
 
}}
 
'''DBpedia'''. Es un proyecto para la extracción de datos de Wikipedia para proponer una versión Web semántica. Este proyecto es realizado por la Universidad de Leipzig, Universidad Libre de Berlín y la compañía OpenLink Software. '''DBpedia''' fue iniciada en 2007 por [[Sören Auer]], [[Christian Bizer]], [[Georgi Kobilarov]], [[Jens Lehmann]], [[Richard Cyganiak]] y [[Zachary Ives]].
 
'''DBpedia'''. Es un proyecto para la extracción de datos de Wikipedia para proponer una versión Web semántica. Este proyecto es realizado por la Universidad de Leipzig, Universidad Libre de Berlín y la compañía OpenLink Software. '''DBpedia''' fue iniciada en 2007 por [[Sören Auer]], [[Christian Bizer]], [[Georgi Kobilarov]], [[Jens Lehmann]], [[Richard Cyganiak]] y [[Zachary Ives]].
 +
 
Es un proyecto que tiene como objetivo extraer contenido estructurado de la información creada en el proyecto [[Wikipedia]]. Esta información estructurada está disponible en la World Wide Web. '''DBpedia''' permite a los usuarios consultar semánticamente las relaciones y las propiedades de los recursos de [[Wikipedia]], incluidos los enlaces a otros conjuntos de datos relacionados.
 
Es un proyecto que tiene como objetivo extraer contenido estructurado de la información creada en el proyecto [[Wikipedia]]. Esta información estructurada está disponible en la World Wide Web. '''DBpedia''' permite a los usuarios consultar semánticamente las relaciones y las propiedades de los recursos de [[Wikipedia]], incluidos los enlaces a otros conjuntos de datos relacionados.
  

Revisión del 14:51 6 jun 2023

DBpedia
Información sobre la plantilla
CreadorSören Auer, Christian Bizer, Georgi Kobilarov, Jens Lehmann, Richard Cyganiak y Zachary Ives.
LicenciaCC-BY-SA 3.0 y GFDL
Sitio web
http://dbpedia.org

DBpedia. Es un proyecto para la extracción de datos de Wikipedia para proponer una versión Web semántica. Este proyecto es realizado por la Universidad de Leipzig, Universidad Libre de Berlín y la compañía OpenLink Software. DBpedia fue iniciada en 2007 por Sören Auer, Christian Bizer, Georgi Kobilarov, Jens Lehmann, Richard Cyganiak y Zachary Ives.

Es un proyecto que tiene como objetivo extraer contenido estructurado de la información creada en el proyecto Wikipedia. Esta información estructurada está disponible en la World Wide Web. DBpedia permite a los usuarios consultar semánticamente las relaciones y las propiedades de los recursos de Wikipedia, incluidos los enlaces a otros conjuntos de datos relacionados.


Inicios

El proyecto fue iniciado por personas de la Universidad Libre de Berlín y la Universidad de Leipzig en colaboración con OpenLink Software, y ahora lo mantienen personas de la Universidad de Mannheim y la Universidad de Leipzig. El primer conjunto de datos disponible públicamente se publicó en 2007. Los datos están disponibles bajo licencias gratuitas (CC BY-SA), lo que permite que otros reutilicen el conjunto de datos; sin embargo, no utiliza una licencia de datos abiertos para renunciar a los derechos de base de datos sui generis. Los artículos de Wikipedia consisten principalmente en texto libre, pero también incluyen información estructurada incrustada en los artículos, como tablas de "cuadro de información" (los paneles desplegables que aparecen en la parte superior derecha de la vista predeterminada de muchos artículos de Wikipedia, o al comienzo de las versiones móviles), información de categorización, imágenes, coordenadas geográficas y enlaces a páginas web externas. Esta información estructurada se extrae y se coloca en un conjunto de datos uniforme que se puede consultar.


Destacado de DBpedia

DBpedia Spotlight es una herramienta para anotar menciones de recursos de DBpedia en el texto. Esto permite vincular fuentes de información no estructurada a la nube de Linked Open Data a través de DBpedia. DBpedia Spotlight realiza la extracción de entidades nombradas , incluida la detección de entidades y la resolución de nombres (en otras palabras, la desambiguación). También se puede utilizar para el reconocimiento de entidades nombradas y otras tareas de extracción de información. DBpedia Spotlight pretende ser personalizable para muchos casos de uso. En lugar de centrarse en unos pocos tipos de entidades, el proyecto se esfuerza por admitir la anotación de todos los 3.5 millones de entidades y conceptos de más de 320 clases en DBpedia. El proyecto comenzó en junio de 2010 en el Grupo de Sistemas Basados en Web de la Universidad Libre de Berlín. DBpedia Spotlight está disponible públicamente como un servicio web para pruebas y una API de Java/ Scala con licencia a través de la licencia de Apache. La distribución DBpedia Spotlight incluye un complemento jQuery que permite a los desarrolladores anotar páginas en cualquier lugar de la Web agregando una línea a su página. Los clientes también están disponibles en Java o PHP. La herramienta maneja varios idiomas a través de su página de demostración y servicios web. La internacionalización es compatible con cualquier idioma que tenga una edición de Wikipedia.


Contenido del dataset

DBpedia está interconectada con GeoNames, Musicbrainz, CIA World Factbook, Proyecto Gutenberg, Eurostat, entre otros. En la base de datos, en solo la versión en inglés, se describen 3,77 millones de entidades, entre ellas al menos 764 mil personas, 563 mil lugares, 112 mil álbumes de música, 72 mil películas y 18 mil videojuegos. Con todas las versiones se tienen 8 millones de enlaces a imágenes, 24,4 millones de enlaces a páginas externas, 27,2 millones de enlaces a datasets externos y 55,8 millones categorías de Wikipedia. El contenido de la base de datos está disponible bajo licencia CC-BY-SA 3.0 y GFDL (ya que el contenido se basa en la Wikipedia). Además de la información extraída de la versión en inglés, en junio de 2011 se implementó la extracción de información de otras Wikipedias, comenzando por 15 de estas, como las versiones en español, alemán, francés, entre otras. En mayo de 2012 se lanzó el sitio web de DBpedia para el idioma español.3 Para el 2013 dispone de 111 versiones en distintos idiomas.


Tecnologías

La información se almacena con el Resource Description Framework. Podemos hacer consultas a la base de datos a través de SPARQL. El motor de extracción de datos se realiza con Scala, un software libre publicado bajo el GNU General Public License. Su código fuente se distribuye: se alberga en sourceforge y disponible a través de Subversion.


Véase también


Fuentes