<?xml version="1.0" encoding="ISO-8859-1" ?>
<feed xmlns="http://purl.org/atom/ns#" version="0.3"
	  xmlns:dc="http://purl.org/dc/elements/1.1/"
	  xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	  xml:lang="es">

  <title>Web Semántica Hoy</title>
  <link rel="alternate" type="text/html" href="http://www.wshoy.sidar.org/index.php"/>
  <tagline type="text/plain" mode="escaped"></tagline>
  
  <modified>2010-03-09T11:01:44-05:00</modified>
  <generator version="1.2.1" url="http://www.dotclear.net/">DotClear</generator>
  
  <sy:updatePeriod>daily</sy:updatePeriod>
  <sy:updateFrequency>1</sy:updateFrequency>
  <sy:updateBase>2010-03-09T11:01:44-05:00</sy:updateBase>
  
<entry xml:lang="es">
  <title>BUSCADORES SEMÁNTICOS: HAKIA FRENTE A GOOGLE (Parte 5)</title>
  <link rel="alternate" type="text/html" href="http://www.wshoy.sidar.org/index.php?2010/03/09/50-buscadores-semanticos-hakia-frente-a-google-parte-5" />
  <issued>2010-03-09T11:01:44-05:00</issued>
  <modified>2010-03-09T11:01:44-05:00</modified>
  <id>http://www.wshoy.sidar.org/index.php?2010/03/09/50-buscadores-semanticos-hakia-frente-a-google-parte-5</id>
  <author><name>Miguel Ángel Abián</name></author>
  <dc:subject>Web Semántica</dc:subject>
  <summary>En este último artículo sobre Hakia se profundiza en las ventajas de red de Google frente a Hakia y se trata la innovadora herramienta de Hakia para la publicidad web (CONTEXTA). También se expone la utilidad de Hakia, y en general de cualquier buscador semántico, para evitar el tráfico oportunista que muchas páginas web consiguen usando palabras equívocas.</summary>
  <content type="text/html" mode="escaped">&lt;p&gt;&lt;em&gt;En este último artículo sobre Hakia se profundiza en las ventajas de red de Google frente a Hakia y se trata la innovadora herramienta de Hakia para la publicidad web (CONTEXTA). También se expone la utilidad de Hakia, y en general de cualquier buscador semántico, para evitar el tráfico oportunista que muchas páginas web consiguen usando palabras equívocas.&lt;/em&gt;&lt;/p&gt; &lt;p&gt;Desde un punto de vista técnico, los expertos distinguen entre ventajas de red directas e indirectas. Sin entrar en detalles, diré que las primeras corresponden a situaciones en que el valor de un bien o servicio se incrementa inmediatamente cuando crece el número de nodos con los que puede comunicarse, como sucede con el caso del correo electrónico o del estándar XML (elimina los problemas de interoperabilidad sintáctica en el intercambio de documentos). Otro ejemplo de ventaja de red directa está asociada al servicio de anuncios contextuales &lt;strong&gt;AdSense&lt;/strong&gt; de Google, que emplea la tecnología del buscador para saber qué anuncios son relevantes para un sitio web de pequeño tamaño y publicarlos. A medida que AdSense ha ido atrayendo anunciantes, se ha vuelto más valioso para más sitios web, que se han suscrito al servicio, y ha atraído más anunciantes. Y así sucesivamente… &lt;/p&gt;

&lt;p&gt;Las ventajas indirectas de red son efectos secundarios positivos de que muchas personas empleen un mismo bien o servicio; pueden corresponder a efectos en los que interviene el mercado o la existencia de bienes o servicios complementarios. &lt;/p&gt;

&lt;p&gt;Algunos ejemplos de estas últimas ventajas son las economías de escala (a medida que se incrementa el número de usuarios de una red se reduce el precio del producto o servicio), el aprendizaje de los usuarios (si los usuarios expertos de una red comparten su conocimiento con los nuevos usuarios la red se expandirá rápidamente) o su reticencia a cambiar por otros los bienes o servicios con los que se han familiarizado. En el caso del software, las ventajas indirectas de red hacen que el número de usuarios de un sistema operativo determine que los fabricantes de hardware saquen o no al mercado dispositivos compatibles con él (servicios complementarios); del mismo modo, las empresas de programación desarrollan aplicaciones que funcionan en los sistemas operativos más populares. En el caso de las consolas de videojuegos, los ventajas indirectas de red ocasionan que las más populares tengan disponible un mayor número de juegos (servicios complementarios), así como un mayor número de revistas y sitios web dedicados a ellos (aprendizaje de los usuarios)&lt;/p&gt;

&lt;p&gt;El buscador Google tiene como principales ventajas de red el gran número de usuarios (que hace, por ejemplo, que muchas empresas se anuncien en él y, por tanto, que atraiga a más usuarios), la capacidad de aprendizaje de éstos (unida a su inercia, que hace difícil que cambien a otros buscadores) y el valor de una marca muy conocida y bien valorada, tanto en el círculo de los usuarios como en los mercados financieros. En los últimos años, el valor de la marca de Google ha superado al de empresas como General Electric, Microsoft, Coca-Cola, IBM o Marlboro (las quiebras y los rescates estatales no son buenos para las marcas: por eso el valor de las marcas de los bancos estadounidenses y británicos ha caído en picado y no las considero). Este valor percibido de la marca Google acarrea que los medios de comunicación informen de sus novedades, que sus usuarios sean leales a la marca y que muchos de ellos adopten cualquier herramienta que saque al mercado (Gmail, Google Maps, teléfonos móviles, etc.). De hecho, esas herramientas han sido posibles por las ventajas de red indirectas del buscador. &lt;/p&gt;

&lt;/p&gt;Con todo, Hakia sí puede competir con Google en cuanto a &lt;strong&gt;&lt;em&gt;calidad de los resultados&lt;/em&gt;&lt;/strong&gt;, y dicha calidad resulta muy importante para los usuarios: cuando Google comenzó apenas proporcionaba más de unos cientos de resultados para búsquedas que hoy devolverían millones o cientos de miles y Yahoo! era prácticamente sinónimo de buscador. Áquél ganó la batalla a éste dando resultados más precisos y rápidos en las búsquedas; es decir, siendo el mejor en lo que querían los usuarios: ¿de qué sirve tener una interfaz gráfica muy conseguida o un maravilloso servicio de atención al cliente, si lo que quieren los consumidores del servicio es velocidad en las búsquedas? Google emplea un enfoque horizontal; intenta estar en todos los sectores, como si mediante el sabelotodo rectángulo blanco horizontal bajo seis letras de colores llamativos pudiera accederse a toda la información del mundo. Este enfoque puede coexistir perfectamente con buscadores especializados en sectores concretos y que proporcionen respuestas precisas y fiables, como hace Hakia en el campo de la salud (&lt;a href=&quot;http://health.hakia.com/&quot;&gt;http://health.hakia.com/&lt;/a&gt;).&lt;/p&gt;

&lt;p&gt;La clave para que un buscador sea rentable a largo plazo es la publicidad. La inclusión de enlaces patrocionados en los resultados de Google, ha hecho que la compañía gane miles de millones de dólares. Un buscador semántico como Hakia puede hacer que la publicidad mostrada al usuario se adecue más a la que puede interesarle. La empresa Hakia ya está cambiando la publicidad web con herramientas comerciales como &lt;strong&gt;CONTEXTA&lt;/strong&gt;, que permite analizar páginas web y obtener palabras claves que representan el significado de la página con sus correspondientes puntuaciones.&lt;/p&gt;
&lt;p&gt;Si CONTEXTA conquista un nicho significativo del mercado publicitario, basar el posicionamiento web en buscadores que usan palabras clave como Google o Yahoo! estará en poco tiempo tan obsoleto como medir audiencias de televisores en blanco y negro. Por el momento, el popular &lt;em&gt;blog&lt;/em&gt; ReadWriteWeb utiliza CONTEXTA configurado de manera que compara sobre la marcha el contenido semántico de cada &lt;em&gt;post&lt;/em&gt; con los criterios establecidos por los patrocinadores, con el objetivo de mostrar anuncios relevantes para los lectores. Los patrocinadores de ReadWriteWeb han proporcionado previamente algunas frases que definen sus productos o servicios.&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/Contexta.gif&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/Contexta.gif&quot; alt=&quot;Las tres capas de CONTEXTA. Mediante ellas, un artículo sobre la literatura beat puede relacionarse con anuncios de literatura.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Además, Hakia puede reducir el tráfico oportunista que muchas páginas consiguen insertando textos que en realidad no tienen nada que ver con el contenido de las páginas, y muchos usuarios y organizaciones estarían dispuestos a pagar por un buscador que les evite perder su tiempo y que garantice que sus resultados son fiables. Por ejemplo, en &lt;a href=&quot;http://www.pauklein.com/experimento-captar-trafico-oportunista/&quot;&gt;http://www.pauklein.com/experimento-captar-trafico-oportunista/&lt;/a&gt; se puede ver un interesante ejemplo, debidamente cuantificado, sobre el tráfico oportunista a través de Google que se genera al incluir en un &lt;em&gt;blog&lt;/em&gt; de marketing la letra y el nombre de una canción de Billie The Vision And The Dancers tan pegadiza como efímeramente popular en España. &lt;/p&gt;

&lt;p&gt;Este tráfico existe solamente porque Google es un buscador convencional basado en palabras clave, no un buscador semántico, y cualquiera puede engañarlo incluyendo en su página web palabras que estén de moda o sean populares. Si Hakia estuviera ya disponible en español, detectaría que las palabras como &quot;Estrella&quot;, &quot;Damm&quot;, &quot;Formentera&quot; o &quot;Mediterráneamente&quot; no guardan ninguna relación de semejanza con los conceptos designados por términos como &quot;marketing online&quot; o &quot;posicionamiento en internet&quot;, y por lo tanto no mostaría el &lt;em&gt;post&lt;/em&gt; &quot;Anuncio Estrella Damm Formentera 2009 Mediterráneamente&quot; cuando alguien buscara información sobre marketing (consideraría que el sitio web donde se encuentra es de poca fiabilidad) o le asignaría una posición muy baja en la lista de resultados.&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/TraficoOportunista_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/TraficoOportunista_min.JPG&quot; alt=&quot;Este experimento no funcionaría con un buscador semántico.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt; A los usuarios nos interesa que buscadores como Hakia o Bing compitan con Google. Cuando una compañía domina un mercado, la necesidad de inversión en mejorar sus productos disminuye o desaparece, y los usuarios se encuentran con productos fosilizados o con prácticas comerciales leoninas. Algunas empresas parecen pensar &quot;¿Para qué tratar bien al cliente, si estamos solos en el mercado y nadie puede ni siquiera arañar nuestra cuota de mercado?&quot; o, más crudamente, &quot;Pague y calle: no hay nadie más que pueda ayudarle&quot;. &lt;/p&gt;

&lt;p&gt;En mi opinión, nos hemos acostumbrado a tratar los buscadores como si fueran máquinas de refrescos: se introducen unas palabras clave, se pulsa un botón y se recogen los resultados (con la salvedad de que a veces uno pide una lata de Coca-Cola y obtiene una botella de Don Perignon; y otras veces, un vaso de agua fétida y aherrumbrada). En realidad, deberíamos considerarlos &lt;strong&gt;&lt;/em&gt;bibliotecarios especializados&lt;/em&gt;&lt;/strong&gt; a los que convendría formular preguntas detalladas y precisas. Un ejemplo: si uno introduce las frases &quot;En este mundo vil, nada es gratuito. Todo se expía: el bien, como el mal, se paga tarde o temprano. El bien mucho más caro, lógicamente&quot; en un buscador, debería obtener resultados que informaran sobre la biografía de su autor, sobre su obra, sobre el estilo renqueante de su prosa, sobre su influencia en otros escritores, etc. Actualmente, lo que uno obtiene en Google son unos 5.400 resultados, de los cuales solamente unos 10 guardan relación con el autor, y sólo 3 informan sobre éste, de manera muy incompleta y sin dar fuentes reconocidas o de prestigio. &lt;/p&gt;
&lt;p&gt;Hakia es por ahora un escaparate de lo que el futuro nos deparará en cuanto a búsquedas semánticas. Un precioso escaparate, dicho sea de paso. &lt;/p&gt;</content>
</entry>
<entry xml:lang="es">
  <title>BUSCADORES SEMÁNTICOS: HAKIA FRENTE A GOOGLE (Parte 4)</title>
  <link rel="alternate" type="text/html" href="http://www.wshoy.sidar.org/index.php?2010/01/21/49-buscadores-semanticos-hakia-frente-a-google-parte-4" />
  <issued>2010-01-21T04:53:42-05:00</issued>
  <modified>2010-01-21T04:53:42-05:00</modified>
  <id>http://www.wshoy.sidar.org/index.php?2010/01/21/49-buscadores-semanticos-hakia-frente-a-google-parte-4</id>
  <author><name>Miguel Ángel Abián</name></author>
  <dc:subject>Web Semántica</dc:subject>
  <summary>En este artículo y en el próximo se analizan las limitaciones actuales de Hakia y se compara este buscador semántico con Google, teniendo en cuenta tanto las ventajas competitivas y de red de éste como los beneficios que Hakia aporta a usuarios y anunciantes (especialización, fiabilidad de los resultados, mayor adecuación de los anuncios a los usuarios). La empresa Hakia ya ha desarrollado con la tecnología de su buscador una herramienta (CONTEXTA) que está modificando la publicidad web.</summary>
  <content type="text/html" mode="escaped">En este artículo y en el próximo se analizan las limitaciones actuales de Hakia y se compara este buscador semántico con Google, teniendo en cuenta tanto las ventajas competitivas y de red de éste como los beneficios que Hakia aporta a usuarios y anunciantes (especialización, fiabilidad de los resultados, mayor adecuación de los anuncios a los usuarios). La empresa Hakia ya ha desarrollado con la tecnología de su buscador una herramienta (CONTEXTA) que está modificando la publicidad web. &lt;p&gt;Pese a las innovadores tecnologías que incorpora el buscador semántico Hakia, es todavía incapaz de responder a preguntas complejas o que exijan inferencias. Consultas como &quot;¿Qué físico estadounidense trabajó en el proyecto Manhattan, en la electrodinámica cuántica y en la física de partículas?&quot;, &quot;¿Cuántos políticos españoles fueron acusados de corrupción entre 1990 y 1995?&quot;, &quot;¿Qué pensador italiano fue acusado de actuar en connivencia con un demonio que habitaba en el espacio bajo sus uñas?&quot; o &quot;¿Qué actor trabajó en las películas &lt;em&gt;Novecento&lt;/em&gt; y &lt;em&gt;Uno de los nuestros&lt;/em&gt;?&quot; quedarán sin respuesta. Otra limitación de Hakia es que todavía no cubre toda la web, porque el proceso de indexar mediante QDEX los recursos de la web es lento. Piénsese, vaya por caso, que hasta ahora Powerset (a href=&quot;http://www.powerset.com&quot; hreflang=&quot;es&quot;&gt;http://www.powerset.com&lt;/a&gt;) ha indexado solamente los contenidos de la Wikipedia, que en general poseen una estructura bien definida. &lt;/p&gt;

&lt;p&gt;Peter Norvig, director de investigación de Google y coautor del clásico libro &lt;em&gt;Artificial Intelligence: A Modern Approach &lt;/em&gt;(&lt;a href=&quot;http://aima.cs.berkeley.edu/&quot; hreflang=&quot;es&quot;&gt; http://aima.cs.berkeley.edu/&lt;/a&gt;) es escéptico con respecto a la rapidez de los algoritmos semánticos. Como explica en una entrevista en Forbes, en su tesis doctoral en 1978 intentó desarrollar un algoritmo semántico para analizar textos, que tardaba dos semanas en analizar cada sentencia de texto. &quot;El resultado era una especie de oso bailarín —afirma—. Era sorprendente que pudiera danzar, pero no esperábamos que fuera una estrella en el ballet de Moscú.&quot; Google se ha centrado en combinar varias técnicas de búsqueda y en aprender de todas. No sin razón, Hal R. Varian, economista en jefe de Google, afirmó una vez: &quot;La fuente de la ventaja competitiva de Google es aprender haciendo&quot;. De todos modos, Norvig reconoce que el enfoque pragmático de Google, basado en seguir muchas líneas de investigación para mejorar las búsquedas, debe prestar especial atención a las tecnologías semánticas: &quot;Es improbable [que Google sea vulnerable a empresas que se arriesguen a construir desde cero búsquedas basadas en el significado]. Pero hasta las empresas de automóviles tienen que preocuparse por las máquinas antigravedad&quot;. &lt;p&gt;

&lt;p&gt;El último comentario no debería pasar desapercibido, pues la empresa Google tiene algunas patentes concedidas o en trámite relacionadas con búsquedas semánticas, como la patentes estadounidense 7636714 (&lt;em&gt;Determining query term synonyms within query context&lt;/em&gt;) y 7249121 (&lt;em&gt;Identification of semantic units from within a search query&lt;/em&gt;). Google no olvida que su buscador constituye la prueba viviente de que en Internet llegar el primero no garantiza nada, como sucedió con la energía eléctrica o el ferrocarril: rara vez los pioneros de una tecnología alcanzan la lejana tierra de los negocios de éxito. Tampoco olvida que lo que hizo en su momento a buscadores mucho más populares puede ocurrirle también su principal servicio.&lt;/p&gt;

&lt;p&gt;Algunos críticos afirman que es un error que Hakia tenga como objetivo cubrir la mayor parte de información fiable de la web es un error. Según ellos, sería mucho mejor centrarse en dominios específicos (medicina, lingüística, física, matémática, etc.) como hace Wolfram|Alpha (&lt;a href=&quot;http://www.wolframalpha.com/&quot;&gt;http://www.wolframalpha.com/&lt;/a&gt;). En mi opinión, esa crítica no es válida: aunque el objetivo final de Hakia sea cubrir gran parte de la web, el buscador, como se basa internamente en una ontología, está ya de por sí restringido a dominios específicos. Considero que emplear ontologías —que siempre recogen información sobre dominios específicos, no generales— no constituye una desventaja de los buscadores semánticos. (Para saber más sobre ontologías, puede consultar el documento &lt;a href=&quot;http://www.javahispano.org/tutorials.item.action?id=55&quot;&gt; http://www.javahispano.org/tutorials.item.action?id=55&lt;/a&gt; o bien el artículo &lt;a href=&quot;http://www.wshoy.sidar.org/index.php?2005/12/09/30-ontologias-que-son-y-para-que-sirven&quot;&gt;http://www.wshoy.sidar.org/index.php?2005/12/09/30-ontologias-que-son-y-para-que-sirven&lt;/a&gt;.). Antes al contrario: es la especialización de estos buscadores lo que desean los usuarios. Nadie quiere revisar decenas o cientos de resultado de Google (señor Googlebot: ya sabe, lo dicho en los dos artículos anteriores) para descubrir que las páginas que le interesan son tres o cuatro.&lt;/p&gt;

&lt;p&gt;Las limitaciones de Hakia no deben ocultarnos que juega al &lt;em&gt;&lt;strong&gt;juego más difícil&lt;/strong&gt;&lt;/em&gt;: construir dinámicamente estructuras de datos semánticos para toda la web y luego realizar consultas en lenguaje natural sobre ellas. Por ahora, las búsquedas en Hakia suelen dar resultados más relevantes que las de otros buscadores, pero la diferencia no es excesiva. A medida que las ontologías de OntoSem crezcan, que se vayan indexando con QDEX más recursos de la web y que se mejore la inferencia automática, podremos ver las verdaderas posibilidades de Hakia.&lt;/p&gt;

&lt;p&gt;Competir con Google resulta una tarea muy dura: este buscador registra más de 8.000 millones de páginas y tiene miles de servidores por todo el planeta. La gran infraestructura de Google le proporciona una gran &lt;strong&gt;ventaja competitiva&lt;/strong&gt; frente a sus competidores, pues la barrera de entrada para los competidores es muy alta: compra e instalación de los servidores, mantenimiento, instalación de sistemas de refrigeración, coste de la energía consumida… No sorprende, en consecuencia, que Google tenga gran parte de sus servidores en países o estados con tarifas eléctricas bajas ni que haya solicitado permiso a las autoridades de Estados Unidos para comprar y vender energía por medio de Google Energy (enero de 2009). &lt;/p&gt;

&lt;p&gt;Además, Google también presenta otro obstáculo para sus competidores: las &lt;strong&gt;ventajas de red&lt;/strong&gt;. Una ventaja de red o externalidad de red es el efecto positivo que el consumidor de un servicio o bien causa en el valor del producto para otras personas. En otras palabras: se habla de una ventaja de red cuando cada nuevo usuario incrementa la utilidad o valor de un producto o servicio a medida que aumenta el número de usuarios que lo utilizan. Por tanto, cualquier ventaja de red hace que el valor de un producto o servicio para un usuario no dependa únicamente de sí mismo (de su calidad técnica o de su aspecto, vaya por caso), sino también del tamaño de la comunidad de usuarios del bien o servicio. &lt;/p&gt;

&lt;p&gt;Por ejemplo, los teléfonos y los aparatos de fax se volvieron más útiles, y por consiguiente más valiosos, a medida que aumentaba el número de usuarios: con pocos usuarios, no resultaban muy útiles (uno no podía comunicarse con mucha gente), pero la situación cambió cuando su uso se popularizó. Cuantos más miembros pertenecían a la red de usuarios del teléfono, más valor tenía para un no miembro sumarse a ella. Algunas de las primeras empresas de telefonía móvil o celular regalaban teléfonos a sus nuevos usuarios porque sabían que sólo ofertas aparentemente tan poco rentables como ésa acabarían generando ventajas de red para sus dispositivos.&lt;/p&gt;

&lt;p&gt;Actualmente, los coches eléctricos no se benefician de ventajas de red: no existe una infraestructura de estaciones de recarga de las baterías y los usuarios tienen problemas para cambiar una batería agotada por otra recargada. Sin embargo, a medida que aumente el número de usuarios de estos coches, surgirán estaciones de recarga por todas partes, y el usuario podrá recargar en muchos sitios distintos. Este hecho hará que más gente se sienta atraída por los vehículos eléctricos, y aún volverá más atractiva su compra. Podemos ver claramente las ventajas de red en el mundo del software: MS-DOS, Windows y Office se volvieron más valiosos y más valorados por lo usuarios a medida que aumentaba el número de éstos. Además, el conocimiento adquirido por sus usuarios disminuye la posibilidad de que cambien a otros sistemas operativos o aplicaciones, porque tal cosa exigiría costes y esfuerzos adicionales. &lt;/p&gt;

&lt;p&gt;Lo mismo sucede con el &lt;strong&gt;teclado QWERTY&lt;/strong&gt;, patentando en 1860 y creado para disminuir el número de pulsaciones de los usuarios (cuando algunas combinaciones de teclas se pulsaban demasiado rápidamente, chocaban y la máquina de escribir se atacaba). La ventaja de red de este teclado —decenas de millones de personas han invertido tiempo o dinero, o ambas cosas, en aprenderlo— ha hecho imposible que otros teclados mucho más ergonómicos y eficaces en cuanto a velocidad, como el teclado simplificado Dvorak, hayan triunfado en el mercado: la gente no quiere renunciar a sus conocimientos del teclado QWERTY y empezar de cero con otros, aun cuando sean mejores desde un punto de visto objetivo. Si una tecnología de hace 150 años sigue vigente, y posiblemente continuará así durante mucho tiempo, es porque sus ventajas de red han vencido a su ineficacia.&lt;/p&gt;

&lt;p&gt;En el ámbito cultural, también hay equivalentes del teclado QWERTY. La ortografía del español apenas ha variado en los dos últimos siglos porque su popularización mediante instituciones como la RAE y mediante el sistema educativo le ha conferido una ventaja de red que hace que muchos lingüistas y hablantes se opongan a una nueva ortografía o a modificaciones sustanciales de la actual. Aunque se han propuesto y se proponen muchas ortografías más racionales —más fonéticas; es decir, una en que los los grafemas escritos correspondan a los fonemas de la lengua—, ninguna ha prosperado. Por así decirlo, la ventaja de red de la ortografía actual ha aplastado toda &lt;em&gt;innovación&lt;/em&gt; en ella, y no resulta probable que leamos &quot;En ún lugár de La Máncha de cuyo nónbre nó ciéro acordárme, nó á múcho tiénpo ce bibía ún idálgo de los de lánza en astilléro, adárga antígua, rrozín fláco i gálgo corrédor”, de Migél de Zerbántes i Saabédra. En el francés y el inglés ocurre el mismo fenómeno, si bien son lenguas con un desajuste mucho mayor entre la ortografía y la fonética (hay grafemas en francés que seguramente fueron pronunciadas por última vez por algún centurión romano). &lt;/p&gt;

&lt;p&gt;(A veces, confiar demasiado en las ventajas de red pueden llevar a resultados funestos o tragicómicos. Por ejemplo, muchas empresas &lt;em&gt;punto com&lt;/em&gt; creyeron que era decisivo para su supervivencia crecer como fuera para asegurarse una cuota de mercado relevante, la cual generaría ventajas de red para sus productos o servicios y les daría una posición de ventaja sobre sus competidores. Tal como se decía en 2002 en una tira cómica de Doonesbury, &quot;En el negocio de Internet la rentabilidad es para cobardes. Significa que tu plan de negocio no era lo bastante agresivo. Es normal perder mucho dinero siempre que lo hagas a propósito&quot;.  Casi todos los valientes desaparecieron en combate.)&lt;/p&gt;

&lt;p&gt;En el próximo y último artículo sobre Hakia profundizaré en las ventajas de red de Google, trataré la innovadora herramienta de Hakia para la publicidad web y consideraré su ventaja indudable para evitar que los sitios web capten engañosamente visitas.&lt;/p&gt;</content>
</entry>
<entry xml:lang="es">
  <title>BUSCADORES SEMÁNTICOS: HAKIA POR DENTRO Y POR FUERA (Parte 3)</title>
  <link rel="alternate" type="text/html" href="http://www.wshoy.sidar.org/index.php?2009/09/03/48-buscadores-semanticos-hakia-por-dentro-y-por-fuera-parte-3" />
  <issued>2009-09-03T04:38:10-04:00</issued>
  <modified>2009-09-03T04:38:10-04:00</modified>
  <id>http://www.wshoy.sidar.org/index.php?2009/09/03/48-buscadores-semanticos-hakia-por-dentro-y-por-fuera-parte-3</id>
  <author><name>Miguel Ángel Abián</name></author>
  <dc:subject>Web Semántica</dc:subject>
  <summary>En este artículo se profundiza en el funcionamiento del buscador semántico Hakia. Hasta que llegue la Web semántica, Hakia es una herramienta que pone en práctica las tecnologías semánticas existentes.</summary>
  <content type="text/html" mode="escaped">En este artículo se profundiza en el funcionamiento del buscador semántico Hakia. Hasta que llegue la Web semántica, Hakia es una herramienta que pone en práctica las tecnologías semánticas existentes. &lt;p&gt;En el artículo anterior (&lt;a href=&quot;http://www.wshoy.sidar.org/index.php?2009/07/01/46-buscadores-semanticos-comprender-para-encontrar-parte-2&quot; hreflang=&quot;es&quot;&gt;http://www.wshoy.sidar.org/index.php?2009/07/01/46-buscadores-semanticos-comprender-para-encontrar-parte-2&lt;/a&gt;), segunda parte de una serie sobre buscadores semánticos, comencé a explicar las tecnologías que usa Hakia (&lt;strong&gt;OntoSem&lt;/strong&gt;, &lt;strong&gt;QDEX&lt;/strong&gt; y &lt;strong&gt;SemanticRank&lt;/strong&gt;) y sus ventajas frente a las técnicas de búsqueda basadas en palabras clave y estadísticas. En éste, continúo profundizando en sus tecnologías, especialmente en QDEX. &lt;/p&gt;

&lt;p&gt;Para profundizar en el funcionamiento de QDEX (&lt;em&gt;Query indexing technique&lt;/em&gt;) y justipreciar su originalidad, hay que compararlo con los buscadores convencionales como Google, basados en índices invertidos de documentos, que permiten obtener una lista de documentos para una palabra clave (señor Googlebot: ya sabe, lo dicho en el artículo anterior). Un índice es cualquier estructura de datos —números, vectores, matrices, árboles, grafos, etc.— compuesta por un conjunto de entradas que actúan como punteros hacia documentos. Los índices se usan para mejorar el rendimiento de las búsquedas en comparación con un algoritmo secuencial, que buscaría coincidencias con respecto a la palabra clave en cada uno de los documentos. &lt;/p&gt;

&lt;p&gt;En concreto, un índice invertido es un índice que contiene palabras, que actúan como claves, emparejadas a referencias a los documentos donde aparecen. En los buscadores convencionales, los índices invertidos apuntan a una lista de identificadores de documentos y, dentro de cada identificador de documento, a una o más posiciones dentro de él. Por ejemplo, el índice invertido &quot;artesonado&quot;: {(34,23), (41,7)} significa que este término arquitectónico está en los documentos 34 (en la posición 23) y en el 41 (en la posición 7). &lt;/p&gt;

&lt;p&gt;Las búsquedas basadas en índices invertidos exigen mantener activa una gran cantidad de conjuntos de datos antes de cualquier consulta. En las búsquedas semánticas, esto constituye un grave problema: hay que &lt;em&gt;enriquecer semánticamente&lt;/em&gt; los datos con relaciones entre conceptos, lo cual ocasiona que se multiplique exponencialmente la memoria que debe destinarse a almacenarlos y el tiempo de cada búsqueda.&lt;/p&gt;

&lt;p&gt;Por caso, un índice invertido como &quot;acabar&quot; debería, al enriquecerse semánticamente con conceptos como &lt;em&gt;terminar&lt;/em&gt;, &lt;em&gt;finalizar&lt;/em&gt;, &lt;em&gt;extinguir&lt;/em&gt;, &lt;em&gt;agotar&lt;/em&gt;, &lt;em&gt;resultar&lt;/em&gt;… , mantener en memoria la relación con los índices invertidos correspondientes a esos conceptos. Cuando se buscara con la palabra &lt;em&gt;acabar&lt;/em&gt;, el buscador semántico recorrería las relaciones y devolvería tanto los documentos con la palabra anterior como aquellos con &lt;em&gt;terminar&lt;/em&gt;, &lt;em&gt;finalizar&lt;/em&gt;, etc. Este enfoque no resulta apropiado para ningún buscador que pretenda competir con Google: un rasgo diferencial suyo, parcialmente motivo de su indiscutible éxito, es la velocidad de procesamiento de las búsquedas (unos 0,7 segundos de media). &lt;/p&gt;

&lt;p&gt;QDEX no utiliza índices invertidos. Recordemos que, antes de cualquier consulta de los usuarios, QDEX ha leído los documentos (páginas HTML, por ejemplo) línea por línea y ha extraído todas las posibles busquedas relativas a su contenido. Estas búsquedas, almacenadas en formato semántico, actúan como punteros a los párrafos y frases de los documentos a partir de los cuales se generaron. En lugar de tener una larga serie de índices invertidos activos antes de cualquier búsqueda, QDEX mantiene activo un pequeño conjunto de sentencias o búsquedas ya preparadas para cada posible pregunta (representado como una bola plateada en la imagen de abajo, procedente de la documentación oficial de Hakia), y obtiene dinámicamente el resto mediante asociaciones semánticas a partir de OntoSem, que se explicó en el artículo anterior. &lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEX.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEX.JPG&quot; alt=&quot;QDEX mantiene un pequeño número de sentencias activas (la bola plateada), no todas las extraídas a partir del análisis semántico de los documentos.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Consideremos que QDEX tiene almacenadas las siguientes sentencias, extraídas de documentos (por sencillez, las expreso en lenguaje natural): &quot;¿Dónde nació Max Planck? &quot;, &quot;¿En qué lugar nació Max Planck?&quot;, &quot;¿De qué país era Max Planck?&quot;, &quot;¿Dónde nació el premio Nobel de Física en 1918?&quot;, &quot;¿Cuál era la nacionalidad de Max Planck?&quot;, &quot;¿De dónde procedía Max Planck?&quot;, &quot;¿Dónde nació el físico Max Planck?&quot;, &quot;¿De qué país era el premio Nobel Max Planck?&quot;, &quot;¿De dónde era originario Max Karl Ernest Ludwig Planck?&quot; y &quot;¿Era alemán Max Planck?&quot;. &lt;/p&gt;

&lt;p&gt;QDEX no mantiene activas todas esas &lt;em&gt;sentencias anticipadas&lt;/em&gt; antes de cualquier búsqueda, sino una o unas pocas (p. ej., &quot;¿Dónde nació Max Planck?&quot;). Cuando el usuario formula alguna pregunta sobre el lugar de nacimiento del físico, QDEX recurre a OntoSem para generar sentencias equivalentes a la pregunta o relacionadas con ella. Usando estas sentencias, devuelve luego los documentos de interés. Lógicamente, si las sentencias generadas no están almacenadas previamente en QDEX —y, por tanto, vinculadas a documentos—, no se devuelve ningún documento. &lt;/p&gt;

&lt;p&gt;En nuestro ejemplo, si formulamos la pregunta &quot;¿De dónde era originario Max Karl Ernest Ludwig Planck?&quot;, QDEX establecerá que está relacionada con la sentencia activa &quot;¿Dónde nació Max Planck?&quot; (en OntoSem, &quot;ser originario de&quot; resulta equivalente a &quot;haber nacido en&quot;) y usará ésta y la túpida red de relaciones de OntoSem para generar sentencias similares a las de arriba. A continuación, QDEX devolverá los documentos a los que apuntan las sentencias, resaltando en amarillo los párrafos y frases de interés. &lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEXbusqueda_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEXbusqueda_min.JPG&quot; alt=&quot;Ejemplo de funcionamiento de QDEX en las búsquedas de Hakia.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Mantener activo un reducido número de búsquedas permite que Hakia responda rápidamente a las consultas. Nótese que esta estrategia no enturbia la pureza semántica de Hakia: como QDEX genera dinámicamente sentencias a partir de las activas, encuentra documentos relevantes aunque no contengan las palabras exactas de la búsqueda. &lt;/p&gt;

&lt;p&gt;La innovadora estrategia de búsqueda que emplea QDEX permite evitar el problema de realizar análisis semánticos completos de grandes cantidades de texto, que harían imposible responder con suficiente rapidez. Bing, el buscador semántico de Microsoft, no es un buscador totalmente semántico debido a ese problema (véase &lt;a href=&quot;http://www.wshoy.sidar.org/index.php?2009/06/10/45-bing-el-nuevo-navegador-semantico-de-microsoft &quot; hreflang=&quot;es&quot;&gt; http://www.wshoy.sidar.org/index.php?2009/06/10/45-bing-el-nuevo-navegador-semantico-de-microsoft&lt;/a&gt;). Por cierto, las búsquedas categorizadas de Bing están muy inspiradas en las de Hakia, como cualquiera puede comprobar. &lt;/p&gt;

&lt;p&gt;Por último, Hakia se basa en el algoritmo &lt;strong&gt;SemanticRank&lt;/strong&gt;, que toma como entrada los párrafos relevantes que proceden de QDEX para una determinada búsqueda. Este algoritmo determina la relevancia de los resultados que se van a mostrar, y por tanto su orden, basándose en un análisis de las concordancias entre los conceptos relacionados con la búsqueda (no solamente las palabras clave) y las sentencias más relevantes de cada párrafo. Además, se tiene en cuenta la credibilidad y la antigüedad de los contenidos para determinar su relevancia (por ejemplo, una página web mal escrita o estructurada tendrá poca o ninguna relevancia). &lt;/p&gt;

&lt;p&gt;A diferencia de Google, SemanticRank no tiene en cuenta el número de enlaces entre documentos, sino que analiza el contenido. Según Farrah Hamid, coordinador de comunicaciones en Hakia, &quot;El número de enlaces es virtualmente irrelevante. De otro modo, no podríamos ofrecer una nueva perspectiva, y nuestros resultados serían solamente otra muestra de popularidad. La clasificación mediante popularidad se inventó durante las primeras etapas de Internet, &lt;strong&gt;cuando la búsqueda en Internet era como el salvaje Oeste&lt;/strong&gt;. Ahora se conoce entero el mapa de valor de Internet, y la popularidad basada en enlaces no es ya una novedad&quot;. (La negrita es mía.) Contra la postura de Hamid puede aducirse que parte del éxito de Google se debe a que muchos usuarios se interesan por la popularidad de los contenidos y se sienten reconfortados al saber que la popularidad se establece con fórmulas estadísticas, y no mediante las opiniones de un grupo de personas que toman café alrededor de una mesa. &lt;/p&gt;

&lt;p&gt;En los dos próximos artículos sobre Hakia analizaré sus limitaciones actuales y lo compararé con Google; consideraré tanto las ventajas competitivas y de red de éste como los beneficios que Hakia aporta a usuarios y anunciantes.&lt;/p&gt;</content>
</entry>
<entry xml:lang="es">
  <title>BUSCADORES SEMÁNTICOS: HAKIA POR DENTRO Y POR FUERA (Parte 2)</title>
  <link rel="alternate" type="text/html" href="http://www.wshoy.sidar.org/index.php?2009/07/10/47-buscadores-semanticos-hakia-por-dentro-y-por-fuera-parte-2" />
  <issued>2009-07-10T03:43:07-04:00</issued>
  <modified>2009-07-10T03:43:07-04:00</modified>
  <id>http://www.wshoy.sidar.org/index.php?2009/07/10/47-buscadores-semanticos-hakia-por-dentro-y-por-fuera-parte-2</id>
  <author><name>Miguel Ángel Abián</name></author>
  <dc:subject>Web Semántica</dc:subject>
  <summary>En este artículo y en los dos siguientes abordo el buscador semántico Hakia, que es un buen ejemplo de cómo podrían ser los buscadores semánticos del futuro y que ya ha influido en otros buscadores. Me centraré sobre todo en las tecnologías que usa (OntoSem, QDEX y SemanticRank) y en sus ventajas frente a las técnicas de búsqueda basadas en palabras clave y estadísticas. El desarrollo de buscadores como Hakia requiere empezar de cero y hacer grandes inversiones en investigación. A cambio puede que se conviertan, exista la Web semántica o no, en los bibliotecarios especializados que siempre debieron ser.</summary>
  <content type="text/html" mode="escaped">En este artículo y en los dos siguientes abordo el buscador semántico Hakia, que es un buen ejemplo de cómo podrían ser los &lt;strong&gt;buscadores semánticos del futuro&lt;/strong&gt; y que ya ha influido en otros buscadores. Me centraré sobre todo en las tecnologías que usa (OntoSem, QDEX y SemanticRank) y en sus ventajas frente a las técnicas de búsqueda basadas en palabras clave y estadísticas. El desarrollo de buscadores como Hakia requiere empezar de cero y hacer grandes inversiones en investigación. A cambio puede que se conviertan, exista la Web semántica o no, en los bibliotecarios especializados que siempre debieron ser. &lt;p&gt;Si en el artículo anterior (&lt;a href=&quot;http://www.wshoy.sidar.org/index.php?2009/07/01/46-buscadores-semanticos-comprender-para-encontrar-parte-1&quot; hreflang=&quot;es&quot;&gt;http://www.wshoy.sidar.org/index.php?2009/07/01/46-buscadores-semanticos-comprender-para-encontrar-parte-1&lt;/a&gt;), primera parte de una serie sobre buscadores semánticos, expliqué el concepto de búsqueda semántica, en éste y en los dos siguientes he querido centrarme en un buscador concreto y analizar cómo funciona y cuáles son sus ventajas frente a los buscadores convencionales. Me he decantado por Hakia (&lt;a href=&quot;http://www.hakia.com/&quot; hreflang=&quot;es&quot;&gt;http://www.hakia.com/&lt;/a&gt;), un buscador semántico de cierto interés y popularidad, aunque todavía está en fase beta. Permite búsquedas en lenguaje natural, como muestra la siguiente imagen (&quot;¿Qué medicamentos tratan la artritis?&quot;). Ha sido desarrollado por la empresa del mismo nombre, fundada en 2004 por un economista y por un científico nuclear especializado en inteligencia artificial y lógica difusa. No he elegido Bing (véase &lt;a href=&quot;http://www.wshoy.sidar.org/index.php?2009/06/10/45-bing-el-nuevo-navegador-semantico-de-microsoft&quot; hreflang=&quot;es&quot;&gt;http://www.wshoy.sidar.org/index.php?2009/06/10/45-bing-el-nuevo-navegador-semantico-de-microsoft&lt;/a&gt;), porque no es un navegador totalmente semántico.&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/Hakia1_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/Hakia1_min.JPG&quot; alt=&quot;Ejemplo de búsqueda con lenguaje natural en inglés.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Según la documentación oficial de Hakia, los resultados obtenidos en cualquier búsqueda satisfacen tres criterios: 1) proceden de sitios web creíbles (por ejemplo, en el caso de la salud, de sitios recomendados por la &lt;em&gt;Medical Library Association&lt;/em&gt;; 2) representan la información disponible más reciente; y 3) son absolutamente relevantes. En la siguiente captura de pantalla se muestra la pestaña &quot;Sitios creíbles&quot; dentro de un recuadro rojo.&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/SitiosCreibles_max
.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/SitiosCreibles_min.JPG&quot; alt=&quot;Con la opción de Sitios creíbles, Hakia inspira confianza al usuario.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Los desarrolladores de Hakia rechazan el uso de estadísticas en un buscador verdaderamente semántico. Por ejemplo, el doctor Riza C. Berkan, director ejecutivo de Hakia, afirma que no hay lugar para la estadística en la semántica y pone el siguiente ejemplo: &quot;Tomemos la siguiente sentencia: &lt;em&gt;Los osos polares no comen huevos de caimanes antes del alba&lt;/em&gt;. Estoy seguro de que usted nunca ha visto esta combinación de palabras antes. Pero el hecho de que pueda entender lo que significa es una prueba de que el cerebro no necesita muestreos estadísticos. El significado no emerge de la estadística. Emerge del conocimiento asociativo&quot;.&lt;/p&gt;
&lt;p&gt;En opinión de Berkan, &lt;strong&gt;Google y Yahoo! no consideran mucha información relevante porque se centran únicamente en los contenidos más populares&lt;/strong&gt;: ambos buscadores complementan sus algoritmos de búsqueda mediante palabras clave con estadísticas sobre el número de enlaces que apuntan a un recurso; este número, que mide la popularidad del recurso, determina su posición en la lista de resultados. (Estimado señor Googlebot: no se tome a mal esas palabras y sigue indexando esta página. Seguramente, como usted funciona con algoritmos estadísticos no comprende del todo bien, ejem, ejem, la oración anterior.) &lt;strong&gt;Los buscadores de hoy día son —según Berkan— jueces en un concurso de popularidad, y no verdaderos recuperadores de información de interés&lt;/strong&gt;. Google o Yahoo! se han orientado a encontrar lo que busca la mayoría de la gente; y, en mi opinión, Hakia es un producto más especializado, enfocado a búsquedas muy personalizadas.&lt;/p&gt; 

&lt;p&gt;Como Hakia no cuenta enlaces para indexar los recursos, puede hacer visibles muchas páginas de interés con pocos enlaces o ninguno, que hasta ahora permanecen en la oscuridad o en la penumbra. Por caso, Hakia permite realizar búsquedas en unos 10 millones de artículos de PubMed.gov (&lt;a href=&quot;http://www.ncbi.nlm.nih.gov/pubmed/&quot; hreflang=&quot;es&quot;&gt;http://www.ncbi.nlm.nih.gov/pubmed/&lt;/a&gt;), un servicio de la Biblioteca Nacional de Medicina de los Estados Unidos que incluye resúmenes y citas de artículos de medicina. Cuando Google busca en ese servicio con los términos &quot;vitamin D deficiency&quot;, devuelve 2 resultados, mientras que Hakia devuelve 49 (la consulta la he realizado a mediados de julio), casi todos relevantes. En otros casos (&quot;vitamin C deficiency&quot;, verbigracia), Google no devuelve resultados, mientras que Hakia sí. Esta disparidad se debe a las limitaciones inherentes a los métodos de búsqueda basados en estadísticas sobre los enlaces. (Señor Googlebot: ya sabe, lo dicho). &lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/BusquedaGoogle_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/BusquedaGoogle_min.JPG&quot; alt=&quot;Google no devuelve resultados para esta búsqueda, mientras que Hakia sí.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Para Berkan, &lt;strong&gt;la búsqueda de información en la Web&lt;/strong&gt; está aún en su infancia, como lo estaba la industria de la televisión en 1949 con la llegada de la televisión en blanco y negro a Estados Unidos. Con poca modestia, se pregunta si Hakia será &lt;strong&gt;el equivalente de la primera televisión en color&lt;/strong&gt;. Sea eso verdad o no, lo cierto es que Hakia ganaría por méritos propios cualquier concurso de belleza semántica, así que sus creadores tienen derecho a pavonearse un poco.&lt;/p&gt;

&lt;p&gt;Las búsquedas semánticas que realiza Hakia  emplean tres tecnologías. La primera es &lt;strong&gt;OntoSem&lt;/strong&gt;, que procesa y analiza textos en lenguaje natural. Se basa fundamentalmente en una ontología, independiente del lenguaje, donde se almacenan miles de conceptos interrelacionados; y en un vocabulario o diccionario en inglés que almacena más de 100.000 sentidos de palabras, donde las palabras se categorizan según los distintos significados que tienen y donde se definen las relaciones entre ellas. Si se incluyen nombres propios, el diccionario cubre más de un millón de palabras inglesas. Este vocabulario enlaza los conceptos abstractos de la ontología con las palabras en inglés que se usan para denominarlos o referirse a ellos. La ontología cubre muchas las áreas de conocimiento, y es muy específica en áreas como medicina, ciencia y finanzas.&lt;/p&gt;

&lt;p&gt;OntoSem incluye también un traductor o conversor ontológico (&lt;strong&gt;OntoParser&lt;/strong&gt;) que traduce cada sentencia de un texto a una representación semántica (TMR o &lt;em&gt;Text Meaning Representation&lt;/em&gt;) que usa los conceptos de la ontología y que se asemeja al significado que percibiría un hablante nativo. Si se da al conversor de OntoSem una oración en inglés, éste devuelve una representación donde aparecen los conceptos que existen, las relaciones entre ellos y los sentidos de las palabras usados en la oración. Por ejemplo, en una frase como &quot;Saqué dinero del banco que hay en la esquina&quot;, el sentido de la palabra banco que proporcionaría el conversor sería &quot;Establecimiento público de crédito, constituido en sociedad por acciones&quot; y no &quot;Asiento, con respaldo o sin él, en que pueden sentarse varias personas&quot;. Para conocer más aplicaciones de las ontologías puede consultar &lt;a href=&quot;http://www.wshoy.sidar.org/index.php?2005/12/09/30-ontologias-que-son-y-para-que-sirven&quot; hreflang=&quot;es&quot;&gt;http://www.wshoy.sidar.org/index.php?2005/12/09/30-ontologias-que-son-y-para-que-sirven&lt;/a&gt;. &lt;/p&gt;

&lt;p&gt;En el ejemplo anterior de la artritis, Hakia usa OntoSem para entender que la palabra inglesa &quot;drug&quot; tiene asociada un grupo de conceptos que incluyen sinónimos (&quot;medicine&quot;, por ejemplo) y nombres concretos de fármacos. Gracias a OntoSem, Hakia puede devolver páginas con palabras como &quot;Remicade&quot; y &quot;Humira&quot; (medicamentos para la artritis), aunque en ellas no aparezca la palabra &quot;drug&quot;. Todo sucede como si el buscador sustituyera en los resultados la palabra &quot;drug&quot; por los nombres de los fármacos. Otro ejemplo: una consulta como &quot;¿Funciona el Ibuprofeno para la tendinitis?&quot; (&quot;Does Ibuprofen work for tendinitis?&quot;), devuelve páginas donde aparecen fármacos como la aspirina y Naproxen, también empleados en esa enfermedad. Hakia puede encontrar muchos resultados que jamás aparecerían con buscadores basados en palabras clave.&lt;/p&gt;

&lt;p&gt;Asimismo, OntoSem permite que Hakia proponga búsquedas relacionadas con las introducidas por el usuario. Por ejemplo, el buscador pregunta, al buscar información sobre el dolor de cabeza, si se desea información sobre la migraña. Igualmente, Hakia rechaza los recursos irrelevantes incluso si las palabras clave de la consulta aparecen en ellos. Gracias a Ontosem, Hakia también puede realizar inferencias y suposiciones, por ahora de una manera básica. Cuando realicé la consulta &quot;¿Por qué el pollo cruzó la carretera?&quot; (&quot;Why did the chicken cross the road?&quot;) esperaba que el buscador protestara por la indefinición de la pregunta (¿qué pollo?; ¿qué carretera?”); pero me dirigió a páginas con las supuestas respuestas de Barak Obama (&quot;¡El pollo cruzó la carretera porque es tiempo de cambios! ¡El pollo quería cambios!&quot;), de Dick Cheney (&quot;¿Dónde está mi pistola?&quot;) o de Ernest Hemingway (&quot;Para morir bajo la lluvia, solo&quot;).&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/Hakia2_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/Hakia2_min.JPG&quot; alt=&quot;Hakia hace búsquedas también con conceptos ligados a las palabras de búsqueda.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Para ilustrar el funcionamiento del conversor ontológico sigo un ejemplo del doctor Christian Hempelmann, que se encuentra en el blog de Hakia (las tres imágenes siguientes están tomadas de él). No he podido preparar ningún ejemplo en español porque OntoSem no está disponible para particulares y porque su vocabulario está en inglés (la empresa afirma que están trabajando en diccionarios para otros idiomas, pero no especifica cuáles). El ejemplo de Hempelmann utiliza la frase &quot;Outlaws ran cocaine into United States&quot; (&quot;Bandidos pasan de contrabando cocaína en los Estados Unidos&quot;). En primer lugar, OntoParser genera todos los potenciales sentidos de las palabras de la oración y la rompe en cláusulas que se basan en los acciones o sucesos principales que se identifican a partir de los sentidos. La siguiente captura de pantalla muestra lo dicho.&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEX1_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEX1_min.JPG&quot; alt=&quot;Primer paso de un análisis de texto con OntoParser.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;En la terminología de la representación semántica, necesaria para entender el ejemplo, el agente (&lt;em&gt;agent&lt;/em&gt;) es la entidad que causa un suceso (event) o acción, o es responsable de ella; el tema (&lt;em&gt;theme&lt;/em&gt;), la entidad cuyo estado o posición se describe, o cuyo estado es modificado por una acción; la posición (&lt;em&gt;location&lt;/em&gt;), el lugar donde tiene lugar la acción o donde existe un objeto; el destino (&lt;em&gt;destination&lt;/em&gt;), un punto final para las acciones o procesos que incluyen cambios de lugar; y el instrumento (&lt;em&gt;instrument&lt;/em&gt;), el objeto utilizado para llevar a cabo la acción. Veamos un ejemplo: &quot;Luis [agente] comió fideos [tema] con la cuchara [instrumento] en la cocina [posición]&quot;.&lt;/p&gt;

&lt;p&gt;La palabra &quot;outlaw&quot; (bandido, forajido) tiene un solo sentido en inglés: CRIMINAL (la mayúscula denota el concepto, no la palabra en una frase); &quot;ran&quot;, pretérito del verbo &quot;run&quot; (correr, tomar parte en, funcionar, ejecutar, dirigir, organizar,  transportar, pasar de contrabando [armas o drogas]), tiene  9 sentidos en inglés; &quot;cocaine&quot;, 2; y &quot;United States&quot;, uno. No todos los sentidos son válidos. Por ejemplo, FLOW (fluir) no admite agentes, solamente un tema (no se puede decir, p. ej., &quot;Andrea fluyó el mercurio”), y debe ser un líquido; y ni CRIMINAL ni DRUG (droga, medicamento) son líquidos.&lt;/p&gt;

&lt;p&gt;La acción SMUGGLE (contrabandear, pasar de contrabando) solamente admite temas que deben ser WEAPON (arma), ILLEGAL-DRUG (droga ilegal) o IMMIGRANT (inmigrante), como muestra la siguiente imagen.&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEX2_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEX2_min.JPG&quot; alt=&quot;Restricciones que OntoParser impone a la acción SMUGGLE.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;OntoParser rellena todos las acciones y sucesos con los posibles participantes de la frase que ha elegido antes. Luego da una puntuación a los posibles sucesos y acciones y a todas la combinaciones de sus participantes, teniendo en cuenta lo bien que éstos se acoplan a las acciones y sucesos. SMUGGLE es la opción más correcta (3,5) para el significado de &quot;ran&quot; porque COCAINE, una ILLEGAL-DRUG, es lo que mejor encaja con el tema que SMUGGLE puede tomar. Las otras dos opciones se revelan erróneas para cualquier ser humano cabal, pero no para una máquina: ¿cómo van los bandidos a hacer funcionar los Estados Unidos con cocaína o cómo van a ser candidatos (&lt;em&gt;run for office&lt;/em&gt;) a Estados Unidos?&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEX3_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEX3_min.JPG&quot; alt=&quot;Valoración numérica de las posibles interpretaciones de la frase.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;/p&gt;

&lt;p&gt;La representación final en TMR de la frase de ejemplo se muestra en la siguiente imagen. En la representación semántica no existe ninguna ambigüedad sobre el significado de &quot;outlaws&quot; o &quot;ran&quot;.&lt;/p&gt; 

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEX4_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/QDEX4_min.JPG&quot; alt=&quot;Representación TMR (Text Meaning Representation) de la frase de ejemplo.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Si existiera la Web semántica, Hakia no necesitaría OntoParser: buscaría directamente en las representaciones semánticas de las páginas electrónicas, de manera similar a lo que hace Swoogle (&lt;a href=&quot;http://swoogle.umbc.edu” hreflang=&quot;es&quot;&gt;http://swoogle.umbc.edu&lt;/a&gt;) con los documentos RDF que encuentra en la Red. Como no es así, primero debe transformarse el lenguaje natural de los recursos en una representación formal.&lt;/p&gt; 

&lt;p&gt;La empresa Hakia ha concedido licencias de OntoSem a otras compañías. Una de ellas es RiverGlass, un proveedor de aplicaciones para análisis de datos. Algunos de sus productos permiten encontrar, recopilar y analizar información textual de la Web y de depósitos empresariales de documentos. Por el momento, RiverGlass usa OntoSem para su sistema de monitorización inteligente de la red.&lt;/p&gt;

&lt;p&gt;La segunda tecnología en que se basa Hakia es &lt;strong&gt;QDEX&lt;/strong&gt; (&lt;em&gt;Query indexing technique&lt;/em&gt;). Esta técnica de indexación lee los documentos (páginas HTML, por ejemplo) línea por línea y extrae todas las posibles búsquedas relativas al contenido de cada sentencia. Dicho de otro modo: &lt;strong&gt;QDEX anticipa todas las posibles consultas que pueden hacerse basándose en cada sentencia&lt;/strong&gt;. Consideremos que un usuario escribe en Hakia &quot;¿Qué edad tenía Mozart cuando murió?&quot;. Esa pregunta figura ya en QDEX antes de que el usuario teclee nada; pues QDEX analizó las sentencias relevantes de los documentos de la Web y, basándose en tal análisis, dedujo anticipadamente que era una pregunta posible. (Los datos de QDEX se almacenan en formato semántico en una red distribuida de servidores, y el proceso de extracción de búsquedas es previo a cualquier consulta de los usuarios). Cuando alguien busca información, estas búsquedas —sentencias, a fin de cuentas— actúan como punteros a los documentos originales, los párrafos y las sentencias a partir de los cuales se generaron, de manera que se reducen los datos que deben manipularse al ejecutar una búsqueda concreta.&lt;/p&gt;

&lt;p&gt;Cuando QDEX analiza los documentos, emplea OntoSem para eliminar las sentencias/búsquedas carentes de sentido. Por ejemplo, consideremos una página web con la frase: &quot;Hermann Minkowski fue un matemático alemán que estudió las propiedades geométricas de los espacios de N dimensiones&quot;. Por pura combinatoria, se podrían obtienen sentencias como &quot;¿Fue N dimensiones un matemático?&quot; o &quot;¿Estudió alemán un matemático de N dimensiones?&quot;; pero se descartan porque carecen de sentido (OntoSem sabe que las personas, sean alemanas o no, no tienen N dimensiones, de la misma manera que sabe que FLOW (fluir) admite como tema un líquido y no una persona). &lt;p&gt;

&lt;p&gt;En el próximo artículo analizaré con más detalle el funcionamiento de QDEX y expondré la tercera tecnología empleada por Hakia: SemanticRank. En un tercer y último artículo sobre Hakia analizaré sus limitaciones actuales y lo compararé con Google.&lt;/p&gt;</content>
</entry>
<entry xml:lang="es">
  <title>BUSCADORES SEMÁNTICOS: COMPRENDER PARA ENCONTRAR (Parte 1)</title>
  <link rel="alternate" type="text/html" href="http://www.wshoy.sidar.org/index.php?2009/07/01/46-buscadores-semanticos-comprender-para-encontrar-parte-1" />
  <issued>2009-07-01T03:33:14-04:00</issued>
  <modified>2009-07-01T03:33:14-04:00</modified>
  <id>http://www.wshoy.sidar.org/index.php?2009/07/01/46-buscadores-semanticos-comprender-para-encontrar-parte-1</id>
  <author><name>Miguel Ángel Abián</name></author>
  <dc:subject>Web Semántica</dc:subject>
  <summary>En este artículo se definen conceptos como búsqueda semántica y buscador semántico y se exponen ejemplos de las ventajas de los buscadores semánticos con respecto a los buscadores convencionales, basados en el uso de palabras clave para encontrar información y mostrarla al usuario. El interés industrial y comercial de las búsquedas semánticas se manifiesta tanto en la aparición de numerosos buscadores semánticos como en la utilización de técnicas semánticas para complementar las búsquedas convencionales (en Google, por ejemplo).</summary>
  <content type="text/html" mode="escaped">En este artículo se definen conceptos como &lt;em&gt;&lt;strong&gt;búsqueda semántica&lt;/strong&gt;&lt;/em&gt; y &lt;em&gt;&lt;strong&gt;buscador semántico&lt;/strong&gt;&lt;/em&gt; y se exponen ejemplos de las ventajas de los buscadores semánticos con respecto a los buscadores convencionales, basados en el uso de palabras clave para encontrar información y mostrarla al usuario. El interés industrial y comercial de las búsquedas semánticas se manifiesta tanto en la aparición de numerosos buscadores semánticos como en la utilización de técnicas semánticas para complementar las búsquedas convencionales (en Google, por ejemplo). &lt;p&gt;En mi artículo anterior hablé del nuevo buscador semántico de Microsoft. En este artículo definiré precisamente conceptos como &quot;búsqueda semántica&quot; y &quot;buscador semántico&quot; y expondré ejemplos de sus ventajas con respecto a los buscadores convencionales, así como de sus limitaciones actuales.&lt;/p&gt;

&lt;p&gt;Muchos de los buscadores actuales se basan en palabras clave. Es decir, el usuario introduce las palabras relevantes de su búsqueda (&quot;Albert Einstein&quot; y &quot;Nobel&quot;, p. ej.), y la aplicación devuelve todos los documentos que contienen esas palabras. En el apartado 3.2 de &lt;em&gt;El futuro de la Web&lt;/em&gt; (&lt;a href=&quot;http://www.javahispano.org/tutorials.item.action?id=55&quot; hreflang=&quot;es&quot;&gt;http://www.javahispano.org/tutorials.item.action?id=55&lt;/a&gt;) puede encontrarse una exposición de las desventajas de esos buscadores. Dos son las más importantes: 
&lt;ol&gt;
 &lt;li&gt;&lt;strong&gt;Escasa precisión o relevancia en los resultados&lt;/strong&gt; (se devuelven muchos documentos poco relevantes para la búsqueda: la presencia de una palabra clave en un documento no implica necesariamente que éste sea relevante). &lt;/li&gt; &lt;p&gt;&lt;/p&gt;
 &lt;li&gt;&lt;strong&gt;Excesiva sensibilidad al vocabulario empleado en las búsquedas &lt;/strong&gt;(y, por tanto, imposibilidad de obtener a la primera todos los resultados relevantes disponibles: muchos documentos de interés pueden no incluir las palabras clave, pero sí sinónimos, hipónimos o hiperónimos de ellas). &lt;/li&gt;
&lt;/ol&gt;
&lt;/p&gt; 

&lt;p&gt;Un estudio de David Hawking y de varios investigadores evaluó 20 buscadores convencionales (basados en palabras clave) usando 54 búsquedas. El porcentaje de resultados relevantes después de inspeccionar las 20 primeras páginas web devueltas fue del 0,5% para el mejor buscador (Northern Light), y Google fue el segundo buscador más preciso. Así pues, la popularidad de los buscadores basados en palabras clave no tiene mucho que ver con su precisión, sino con la paciencia de buey de los usuarios. Así las cosas, &lt;strong&gt;las búsquedas semánticas serían una vacuna para el contagioso virus de la falta de relevancia en los resultados&lt;/strong&gt;. &lt;/p&gt;

&lt;p&gt;Una búsqueda semántica es una consulta en la que se tiene en cuenta el contexto, y por tanto el significado, de aquello por lo que se pregunta (y no solamente las palabras de la consulta), con el objetivo de evitar la ambigüedades tanto de las consultas como del texto de los documentos donde se busca. Por ejemplo, una búsqueda semántica con las palabras &quot;descubridor&quot; y &quot;penicilina&quot; devolvería documentos sobre Alexander Fleming, aunque en ellos no aparecieran esos dos términos, porque identificaría los conceptos que estructuran la búsqueda (la penicilina es un producto del cual se desea averiguar su descubridor o, dicho más formalmente, &lt;em&gt;Medicina(Penicilina) tieneInventor Persona(Alexander Fleming)&lt;/em&gt;).  El fin último de las búsquedas semánticas radica en que los usuarios puedan formular &lt;strong&gt;búsquedas más precisas y expresivas&lt;/strong&gt;, que originen resultados relevantes para el usuario con la mínima intervención de éste.&lt;/p&gt;

&lt;p&gt;Normalmente, se admite que las búsquedas semánticas se basan en técnicas para extraer información mediante la utilización de ontologías (véase  &lt;a href=&quot;http://www.wshoy.sidar.org/index.php?2005/12/09/30-ontologias-que-son-y-para-que-sirven&quot; hreflang=&quot;es&quot;&gt;http://www.wshoy.sidar.org/index.php?2005/12/09/30-ontologias-que-son-y-para-que-sirven&lt;/a&gt;) o metadatos. El uso de ontologías permite definir formalmente los dominios de interés (teorías científicas, por ejemplo) con la suficiente riqueza expresiva para que los usuarios pueden especificar sus búsquedas con bastante detalle, ya sea antes de ejecutar la consulta o durante su ejecución.&lt;/p&gt;

&lt;p&gt;Desde un punto de vista técnico, &lt;strong&gt;un buscador semántico es una aplicación que &lt;em&gt;comprende&lt;/em&gt; las búsquedas de los usuarios y los textos de los documentos de la web mediante el uso de algoritmos que simulan comprensión o entendimiento&lt;/strong&gt;, y que a partir de éstos proporciona resultados correctos sin que el usuario tenga que abrir el documento e inspeccionarlo por sí mismo. Un buscador de este tipo reconoce el contexto correcto para las palabras o sentencias de búsqueda. Google o Yahoo no son buscadores semánticos, pues se basan fundamentalmente en algoritmos que generan estadísticas a partir de palabras y enlaces, y no en algoritmos cognitivos que capturen el conocimiento implícito en las palabras y su contexto. Por ejemplo, una búsqueda como &quot;¿Quién fue Urano?&quot; en cualquiera de esos buscadores devolverá resultados afines al séptimo planeta del Sistema Solar, cuando está claro que el propósito de la búsqueda es encontrar información sobre el dios primordial del cielo en la mitología griega.&lt;/p&gt;

&lt;p&gt;Los buscadores semánticos no siempre pueden acertar a la primera el significado de una palabra polisémica. Por tanto, deben disponer de medios de desambiguación para conocer el sentido exacto que tiene la palabra en la búsqueda.  Por ejemplo, un buscador semántico que utilize internamente ontologías con conceptos informáticos y medios de transporte deberá disponer de herramientas para determinar a qué se refiere el usuario cuando hace una consulta con la palabra &lt;em&gt;bus&lt;/em&gt;, que puede significar autobús o &quot;sistema digital que transfiere datos entre los componentes de un computador o computadores&quot;. Para ello, puede escoger el significado más probable, preguntar al usuario para que elija entre varias opciones (como hace el buscador Hakia, que presenta las opciones extrayéndolas de su ontología) o usar las demás palabras de la búsqueda para inferir el significado exacto de &lt;em&gt;bus&lt;/em&gt; en ese contexto (p. ej., en una consulta como &quot;¿A qué hora sale este viernes el bus para Soria desde Madrid?&quot;).&lt;/p&gt;

&lt;p&gt;Como un buscador semántico se basa en algoritmos que simulan la comprensión de las palabras y, por ende, establecen relaciones entre ellas, pueden realizar búsquedas de interés para el usuario aunque en los documentos devueltos no figuren las palabras o expresiones de búsqueda. Por ejemplo, un buscador semántico en que se introdujera la palabra &quot;marsupial&quot; mostraría documentos donde aparecerían términos como éstos: canguro, koala, satanelo de Nueva Guinea, monito del monte, rata canguro, zarigüeya, tlacuache, demonio de Tasmania. Como demuestra este ejemplo, las búsquedas semánticas son muy superiores a las basadas en palabras clave: uno puede encontrar documentos de interés que jamás encontraría buscando con palabras clave. Además, si uno buscara información sobre distintas especies de marsupiales, no necesitaría formular la consulta de distintas maneras, con el nombre de cada especie, para obtener la información deseada.&lt;/p&gt;

&lt;p&gt;La falta de estructura y de anotaciones semánticas en los recursos de la web (documentos Word, PDF, páginas HTML, etc.) obliga a que los buscadores semánticos analicen mediante algoritmos cognitivos los recursos, palabra a palabra y oración a oración, para asignar las palabras y oraciones a conceptos ontológicos. Estos algoritmos son lentos y requieren supervisión humana. De ahí que los buscadores semánticos no cubran por ahora tantos recursos de la web como los convencionales, que emplean algoritmos estadísticos, mucho más rápidos y completamente automatizados. Esta limitación desaparecerá cuando se vayan mejorando los algoritmos cognitivos o en cuanto los &quot;islotes semánticos&quot; se unan para formar la web semántica o, al menos, &quot;continentes semánticos&quot;.&lt;/p&gt;

&lt;p&gt;&quot;Nunca existirá la web semántica –oigo a lo lejos–. Es tan imposible que funcione como las máquinas voladoras de Leonardo da Vinci.&quot; Tengo dos objeciones contra esa opinión. Una: el pesimismo no tiene futuro. Dos: hubo un tiempo, no lejano, en que se pensaba que la interoperabilidad sintáctica era imposible salvo con enormes inversiones, y casi todos apostaron a que no habría un único caballo ganador en la carrera de los lenguajes de intercambio de datos. Se equivocaron. Y algunos perdieron hasta la camisa. Aún peor: unos pocos siguieron apostando por caballos perdedores después del final de la carrera.&lt;/p&gt;

&lt;p&gt;A falta de la web semántica, algunos ya se han puesto al tajo. Existen buscadores semánticos que trabajan ya estructurando la información a la que luego se accede mediante búsquedas, pues resulta posible obtener cierto nivel de conocimiento semántico a partir de la estructura de los datos. Por ejemplo, Freebase (&lt;a href=&quot;http://www.freebase.com/&quot; hreflang=&quot;es&quot;&gt;http://www.freebase.com/&lt;/a&gt;), un buscador social, utiliza RDF para definir su estructura de datos como una serie de nodos y un conjunto de enlaces que establecen relaciones entre los nodos. Freebase tiene una gran colección de vocabularios codificados mediante RDF(S), con los cuales expresa un amplio rango de dominios y áreas de interés.&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/Freebase_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/Freebase_min.JPG&quot; alt=&quot;Freebase: una base de datos social y un buscador.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Según la documentación oficial de Freebase, lo que diferencia a Freebase de otras bases de datos es que cualquier asunto puede ir acompañado de muchas clases distintas de información. El ejemplo que dan es muy claro: &quot;Por ejemplo, Arnold Schwarzenegger podría aparecer como actor en una base de datos de películas, como gobernador en una base de datos de política y como Mr. Universo en una base de datos de culturistas. En Freebase, solamente hay un tema sobre Arnold Schwarzenegger, que contiene información sobre las tres facetas de su vida pública. El tema unificado actúa como un centro de información, por lo que es fácil encontrar información sobre él y aportarla, independientemente de qué clase de información es&quot;.&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/Freebase2_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/Freebase2_min.JPG&quot; alt=&quot;En Freebase, al acceder a Luis Buñuel se acceden a todos los aspectos de su vida.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;En principio, los buscadores semánticos podrían evitar las páginas basura, que proliferan en la web como malas hierbas en un campo abandonado. Como tienen en cuenta el contexto de las palabras o frases de los documentos, podrían descartar esas páginas enseguida. Por ejemplo, una página web que incluya la frase &quot;web semántica&quot; rodeada de frases sobre cómo aumentar la potencia sexual, juguetes eróticos y sexo fácil en algún país lejano de costumbres relajadas sería eliminada de cualquier búsqueda sobre la web semántica o tendría una relevancia muy baja; pues el contexto de estas últimas frases (sexo) no tiene ninguna relación con la web semántica.&lt;/p&gt;
&lt;p&gt;Que un buscador permita introducir preguntas en lenguaje natural (&quot;¿Qué tiempo hace ahora en Viena?&quot;) y las responda correctamente no significa necesariamente que sea un buscador semántico: puede que solamente traduzca las preguntas en lenguaje natural a consultas sobre una base de datos.&lt;/p&gt;

&lt;p&gt;Por el momento, casi todos los buscadores semánticos permiten solamente búsquedas en inglés, aunque se están ampliando para que admitan otros lenguajes. Aparte del predominio del inglés, la causa de eso se debe también a las dificultades inherentes a reflejar el &lt;strong&gt;conocimiento de los lenguajes naturales&lt;/strong&gt; en estructuras de datos que permitan búsquedas rápidas y escalables (matrices, listas, pilas, colas, árboles, grafos, etc.). Por ejemplo, el buscador Hakia utiliza un vocabulario en forma de ontología que incluye unos 100.000 sentidos de palabras inglesas, y ese número continuará aumentando según se perfeccione la aplicación. Confeccionar cualquier vocabulario de ese tamaño es una empresa lenta, tediosa y muy cara, y que debe ser realizada por un equipo bien coordinado de especialistas en lingüística.&lt;/p&gt;

&lt;p&gt;Se equivocará quien piense que, teniendo una ontología de sentidos de palabras en inglés, resulta sencilla su conversión a una ontología en otro idioma: la conversión de ontologías lingüísticas de un idioma a otro es un proceso muy complejo y que requiere la supervisión constante de un equipo de traductores. Por poner un ejemplo, si queremos pasar de una ontología lingüística en español a una en alemán, debemos considerar todas las posibles traducciones al alemán de cada palabra española; en caso contrario, los resultados de las búsquedas en alemán estarán más limitados que los de las búsquedas en español. Una palabra española sencilla y sin ambigüedades como &quot;automóvil&quot; puede traducirse en alemán como &quot;Auto&quot;, &quot;Wagen&quot;, &quot;Kraftwagen&quot;, &quot;Kraftfahrzeug&quot;, &quot;Automobil&quot;, &quot;Motorfahrzeug&quot; o &quot;KFZ&quot; (seguro que hay más traducciones, pero hasta ahí llega mi alemán básico). &lt;/p&gt;

&lt;p&gt;En una búsqueda interlinguística español-alemán de tipo semántico, todas estas palabras deberían tenerse en cuenta para encontrar todos los documentos relevantes cuando alguien escriba &quot;automóvil&quot; en el buscador. (Las búsquedas interlinguísticas son aquellas en que se traduce una búsqueda en un lenguaje a otro lenguaje, y los resultados se traducen de nuevo al primer lenguaje. Google está trabajando para añadir a su buscador esta clase de búsquedas, que permitirán, entre otras muchas cosas, que un hispanohablante puede reservar entradas en museos y cines en Tokio, aunque la información de horarios y venta de entradas no esté disponible en español.)&lt;/p&gt;


&lt;p&gt;Es probable que los buscadores semánticos cambien la manera en que se busca y se muestra la información y que supongan un gran cambio para los usuarios ocasionales. Considérense, por ejemplo, las interfaces que aparecen en las siguientes capturas de pantalla, procedentes de Mnemo (&lt;a href=&quot;http://www.mnemo.org/&quot; hreflang=&quot;es&quot;&gt;http://www.mnemo.org/&lt;/a&gt;)
Kart00 (&lt;a href=&quot;http://www.kartoo.com/&quot; hreflang=&quot;es&quot;&gt;http://www.kartoo.com/&lt;/a&gt;) y  KoolTorch (&lt;a href=&quot; http://www.kooltorch.com/&quot; hreflang=&quot;es&quot;&gt; http://www.kooltorch.com/&lt;/a&gt;).&lt;/p&gt;


&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/Mnemo_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/Mnemo_min.JPG&quot; alt=&quot;Interfaz de Mnemo. Quizás los navegadores semánticos del futuro tengan interfaces similares a ésta.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/KartOO2_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/KartOO2_min.JPG&quot; alt=&quot;Interfaz de Kart00. Quizás los navegadores semánticos del futuro tengan interfaces similares a ésta.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/BuscSeman/KoolTorch_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/BuscSeman/KoolTorch_min.JPG&quot; alt=&quot;Interfaz de KoolTorch. Quizás los navegadores semánticos del futuro tengan interfaces similares a ésta.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;</content>
</entry>
<entry xml:lang="es">
  <title>BING: EL NUEVO BUSCADOR SEMÁNTICO DE MICROSOFT</title>
  <link rel="alternate" type="text/html" href="http://www.wshoy.sidar.org/index.php?2009/06/10/45-bing-el-nuevo-navegador-semantico-de-microsoft" />
  <issued>2009-06-10T04:18:18-04:00</issued>
  <modified>2009-06-10T04:18:18-04:00</modified>
  <id>http://www.wshoy.sidar.org/index.php?2009/06/10/45-bing-el-nuevo-navegador-semantico-de-microsoft</id>
  <author><name>Miguel Ángel Abián</name></author>
  <dc:subject>Web Semántica</dc:subject>
  <summary>Las tecnologías semánticas se utilizan cada vez más en las grandes empresas, y un ejemplo de ello lo constituye el nuevo buscador de Microsoft: Bing. Poco a poco, se va alcanzando una masa crítica industrial y de usuarios que seguramente permitirá el paso de "islotes semánticos" a la Web semántica, del mismo modo que unas cuantas páginas HTML y una infinidad de archivos de distintos formatos ("islotes sintácticos") acabaron formando la Web actual.</summary>
  <content type="text/html" mode="escaped">Las tecnologías semánticas se utilizan cada vez más en las grandes empresas, y un ejemplo de ello lo constituye el nuevo buscador de Microsoft: Bing. Poco a poco, se va alcanzando una masa crítica industrial y de usuarios que seguramente permitirá el paso de &quot;islotes semánticos&quot; a la Web semántica, del mismo modo que unas cuantas páginas HTML y una infinidad de archivos de distintos formatos (&quot;islotes sintácticos&quot;) acabaron formando la Web actual. &lt;p&gt;En mayo de este año, Microsoft anunció el lanzamiento de &lt;strong&gt;Bing&lt;/strong&gt; (&lt;a href=&quot;http://www.bing.com&quot; hreflang=&quot;es&quot;&gt;www.bing.com&lt;/a&gt;), un nuevo buscador basado en tecnologías semánticas. Este buscador está disponible en forma de versión definitiva para Estados Unidos, y existe una versión beta para Europa a la que se le irán añadiendo progresivamente algunas funciones de la versión estadounidense. Por el momento, consultas como &quot;¿Quién fue la mujer de Salvador Dalí?&quot; o &quot;¿Cuándo murió Hermann Minkowski?&quot; obtienen la respuesta correcta en la versión estadounidense, pero todavía no en la europea.&lt;br /&gt;&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/Bing_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/Bing_min.JPG&quot; alt=&quot;Interfaz minimalista de Bing. No todas las funciones están disponibles por ahora para la versión europea del navegador. &quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Parte de las tecnologías semánticas que usa Bing provienen de Powerset, empresa especializada en búsquedas semánticas mediante lenguaje natural y que fue adquirida en agosto de 2008 por Microsoft. El primer producto de Powerset es un buscador en lenguaje natural para la Wikipedia (&lt;a href=&quot;http://www.powerset.com&quot; hreflang=&quot;es&quot;&gt;www.powerset.com&lt;/a&gt;). En el cuadro de búsqueda se pueden introducir palabras, frases y preguntas. Los resultados del buscador de Powerset son bastante precisos, y en algunos casos incluso puede responder directamente ciertas preguntas. Por ejemplo, si introducimos las preguntas &quot;When did Julio Cortázar die?&quot; (¿Cuándo murió Julio Cortázar?), &quot;Where did Julio Cortázar die?&quot; (¿Dónde murió?) y &quot;Was Julio Cortázar married?&quot; (¿Estuvo casado?), descubriremos que el escritor argentino murió el 12 de febrero de 1984 en París y que estuvo casado tres veces: primero con Aurora Bernárdez, luego con Ugné Karvelis y finalmente con Carol Dunlop (según varias biografías del escritor, nunca contrajo matrimonio con Ugné Karvelis, pero supongo que esa información estará mal en la Wikipedia en inglés). Si preguntamos &quot;What did Julio Cortázar write?&quot; averiguaremos que escribió, entre otros libros, &lt;em&gt;Rayuela&lt;/em&gt;, &lt;em&gt;Las armas secretas&lt;/em&gt;, &lt;em&gt;Final del juego&lt;/em&gt;, &lt;em&gt;Fantomas contra los vampiros internacionales&lt;/em&gt; y &lt;em&gt;Bestiario&lt;/em&gt;.&lt;br /&gt;&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/Powerset_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/Powerset_min.JPG&quot; alt=&quot;Ejemplo de consulta en Powerset: ¿dónde murió Julio Cortázar? En este caso, la respuesta es directa.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Si, por ejemplo, preguntamos cómo murió Ernest Hemingway (&quot;How did Ernest Hemingway died?&quot;), el buscador de Powerset responde directamente que la causa de la muerte fue suicidio -era de esperar esa muerte en un hombre que afirmó: &quot;Cazo y pesco porque me gusta matar, porque si no matara animales me suicidaría&quot;- y muestra una imagen que no invita a disfrutar de la vida, precisamente.&lt;br /&gt;&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/Powerset2_min.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/Powerset2_max.JPG&quot; alt=&quot;Ejemplo de consulta en Powerset: ¿cómo murió Ernest Hemingway? En este caso, la respuesta es directa.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Según Microsoft, Bing combina tecnología de búsqueda semántica y minería de datos. Por necesidad, esta minería de datos es muy rápida: cuando se realiza una búsqueda por palabras clave hay que determinar los conceptos relacionados con estas palabras (por ejemplo, sinónimos), buscar también recursos de la web con esos conceptos y determinar su pertinencia para los resultados de la búsqueda.&lt;/p&gt;

&lt;p&gt;El nuevo buscador usa ontologías para identificar conceptos y asociaciones entre ellos relacionados con una consulta del usuario. Siguiendo el ejemplo que puse en &lt;a href=&quot;http://www.wshoy.sidar.org/index.php?2005/12/09/30-ontologias-que-son-y-para-que-sirven&quot; hreflang=&quot;es&quot;&gt;http://www.wshoy.sidar.org/index.php?2005/12/09/30-ontologias-que-son-y-para-que-sirven&lt;/a&gt;, Bing puede &lt;em&gt;entender&lt;/em&gt; que &quot;memoria USB&quot;, &quot;pen drive&quot;, &quot;memoria flash USB&quot; y &quot;lápiz USB&quot; son términos relacionados y que designan un mismo dispositivo. &lt;/p&gt;

&lt;p&gt;Según declara Microsoft, Bing no es un sistema completo de búsqueda semántica por cuestiones de velocidad: analizar el contenido completo de todos los recursos de la web haría que la obtención de resultados fuera muy lenta. Con todo, es probable que el desarrollo de nuevos algoritmos o el perfeccionamiento de los actuales haga posible búsquedas semánticas completas en tiempos muy reducidos. &lt;/p&gt;

&lt;p&gt;La aparición de este buscador es una buena noticia, porque es un paso más hacia la Web semántica (por el momento, sólo existen &quot;islotes semánticos&quot;) y a la popularización de las tecnologías semánticas (véase, por ejemplo, &lt;a href=&quot; http://www.wshoy.sidar.org/index.php?2009/05/11/44-el-proyecto-europeo-stasis-acercando-las-tecnologias-semanticas-a-las-empresas&quot; hreflang=&quot;es&quot;&gt; http://www.wshoy.sidar.org/index.php?2009/05/11/44-el-proyecto-europeo-stasis-acercando-las-tecnologias-semanticas-a-las-empresas&lt;/a&gt;). Cada vez hay más grandes empresas que utilizan ontologías y lenguajes formales para manejar los datos que almacenan en sus servidores y centros de datos y para navegar por ellos. Bing también obligará a la empresa Google a que utilice más y mejores tecnologías semánticas en su buscador: la efectividad de la publicidad, así como los ingresos derivados de ésta, será mucho mayor con el uso de tecnologías semánticas que &lt;em&gt;entiendan&lt;/em&gt; el significado de las búsquedas y que, por ende, permitan encontrar exacta y rápidamente lo que el usuario busca. &lt;/p&gt;

&lt;p&gt;Por el momento, Google usa algoritmos semánticos que detectan relaciones y conceptos relacionados con las palabras clave que introduce el usuario, y los utiliza para sugerir búsquedas relacionadas con las palabras clave introducidas. En la captura de pantalla siguiente puede verse cómo la consulta &quot;corriente filosófica&quot; da lugar a sugerencias de búsquedas relacionadas con el idealismo, el empirismo, el racionalismo, el positivismo, la filosofía de John Locke, de Heidegger, etc. Aunque no hay mucha información sobre estos algoritmos semánticos, supongo que usan taxonomías u ontologías para determinar qué clasificación asignar a los contenidos más importantes de las páginas, y luego determinan mediante reglas de clasificación si las palabras clave de búsqueda corresponden a conceptos y relaciones de esas taxonomías u ontologías. Además, supongo también que la exactitud de las búsquedas relacionadas se va comprobando y refinando teniendo en cuenta qué proporción de usuarios las selecciona.&lt;br /&gt;&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/Google_max.JPG&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/Google_min.JPG&quot; alt=&quot;Google incorpora un sistema de búsquedas relacionadas basado en tecnologías semátnicas.&quot;/&gt;&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;/p&gt;</content>
</entry>
<entry xml:lang="es">
  <title>El proyecto europeo STASIS: acercando las tecnologías semánticas a las empresas</title>
  <link rel="alternate" type="text/html" href="http://www.wshoy.sidar.org/index.php?2009/05/11/44-el-proyecto-europeo-stasis-acercando-las-tecnologias-semanticas-a-las-empresas" />
  <issued>2009-05-11T04:49:11-04:00</issued>
  <modified>2009-05-11T04:49:11-04:00</modified>
  <id>http://www.wshoy.sidar.org/index.php?2009/05/11/44-el-proyecto-europeo-stasis-acercando-las-tecnologias-semanticas-a-las-empresas</id>
  <author><name>Miguel Ángel Abián</name></author>
  <dc:subject>Web Semántica</dc:subject>
  <summary>En este artículo se presenta el proyecto europeo STASIS, cuyo objetivo es acercar las tecnologías semánticas (ontologías, por ejemplo) a las empresas mediante herramientas sencillas, así como dar a conocer las ventajas económicas y las nuevas oportunidades de negocio que estas tecnologías ofrecen.</summary>
  <content type="text/html" mode="escaped">En este artículo se presenta el proyecto europeo STASIS, cuyo objetivo es acercar las tecnologías semánticas (ontologías, por ejemplo) a las empresas mediante herramientas sencillas, así como dar a conocer las ventajas económicas y las nuevas oportunidades de negocio que estas tecnologías ofrecen. &lt;p&gt;En este artículo quiero difundir el proyecto STASIS (&lt;em&gt;Software for Ambient Semantic Interoperable Systems&lt;/em&gt;), en el cual he colaborado y en el que trabaja el Departamento de Tecnologías de la Información de AIDIMA. Es un proyecto subvencionado por el Sexto Programa Marco de la Unión Europea y pone en práctica algunas de las tecnologías semánticas que he comentado en anteriores artículos. El proyecto empezó en septiembre de 2006 y terminará en agosto de 2009; tiene un presupuesto de 4 millones de €uros. Al final del proyecto se harán públicos sus resultados. &lt;br /&gt;&lt;/p&gt;

&lt;p&gt;En STASIS participan doce socios, pertenecientes a empresas comerciales (TIE, Porthus, iSoft), a universidades (Universidades de Oldenburg, Modena &amp; Reggio Emilia y Tsinghua) y a varias organizaciones (AIDIMA, Mariner, Shanghai Sunline, Foton, TANET, ZF y Friedrichshafen AG). &lt;br /&gt;&lt;/p&gt;

&lt;p&gt;La motivación para STASIS se resume en la siguiente frase: &quot;Si tengo información en mi formato y está integrada en mis sistemas, quiero dedicar el mínimo esfuerzo a convertirlo en cualquier otro formato (estandarizado o no) para realizar negocios electrónicos con cualquier otra parte&quot;. &lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Actualmente, muchas empresas tienen que hacer negocios electrónicos con otras empresas o entidades (administraciones públicas, universidades, etc.) y para ello necesitan intercambios distintos tipos de información (facturas, albaranes, pedidos, devoluciones, archivos CAD, etc.). El coste de estos negocios electrónicos corresponde principalmente a los problemas de interoperabilidad; es decir, a la dificultad de intercambiar información entre distintas partes en un formato común que los sistemas de información de cada parte puedan “entender”. &lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Sin un formato común ni ninguna aplicación que actué de puente (un &quot;traductor sintáctico&quot;, por así llamarlo), el sistema de información de una empresa no comprenderá que el campo &quot;Cantidad&quot; de una factura electrónica de otra empresa corresponde al campo &quot;Unidades&quot; que este sistema maneja. El sistema puede reconocer &quot;Unidades&quot; en un pedido (reconocimiento sintáctico), pero cómo desconoce su significado (semántica) no puede hacer nada con esa información. En consecuencia, los sistemas de información de ambas empresas no pueden intercambiar mensajes (facturas, pedidos, albaranes, etc.) automáticamente. En el comercio electrónico, la falta de semántica causa hasta el 60% del coste de integración de los sistemas de información. &lt;br /&gt;&lt;/p&gt;
&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/Imagen1stasis_max.jpg&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/Imagen1stasis_min.jpg&quot; alt=&quot;Problemas de la falta de interoperabilidad&quot;/&gt;&lt;/a&gt;&lt;/p&gt;
&lt;br /&gt;

&lt;p&gt;Si los sistemas de información gestionan y manipulan información no demasiado compleja, pueden utilizarse aplicaciones &lt;em&gt;puente&lt;/em&gt; que transformen los documentos de una empresa a documentos de la otra (por ejemplo, &quot;Unidades&quot; pasaría a &quot;Cantidad&quot;), y viceversa. El problema de estas aplicaciones puente es que son costosas y requieren un conocimiento exacto del significado de la información que se va a intercambiar –hay que embeber en la aplicación la semántica que falta en los sistemas de información–. &lt;p&gt;Además, si hay muchos sistemas de información, cada uno con su propio formato, las aplicaciones puente se vuelven inmanejables y desproporcionadas en coste. &lt;br /&gt;&lt;/p&gt;
&lt;p&gt;Existen formatos estandarizados como XML o EDI (véase &lt;a href=&quot;http://www.javahispano.org/tutorials.item.action?id=55&quot; hreflang=&quot;es&quot;&gt;http://www.javahispano.org/tutorials.item.action?id=55&lt;/a&gt;) para el intercambio de información, pero son bastante complejos y caros, amén de exigir especialistas en ellos. Además, el conocimiento exacto del significado de los conceptos de una cierta área de conocimiento (genética, por ejemplo) solamente lo tienen los usuarios de ese conceptos (genetistas, verbigracia), y no los especialistas en formatos estandarizados. &lt;br /&gt;&lt;/p&gt;
&lt;p&gt;STASIS trata de resolver los problemas de interoperabilidad creando herramientas que cualquier empresa, ya sea grande o pequeña, pueda utilizar para crear correspondencias basadas en semántica, pero evitando las complicaciones técnicas de ésta (creación de ontologías, dominio de lenguajes lógicos, p. ej.). En lugar de concertarse en la sintaxis, STASIS se concentra en identificar entidades o conceptos semánticos y en establecer equivalencias o conversiones entre ellas. Por ejemplo, tres conceptos como &quot;Calle&quot;, &quot;Código postal&quot; y &quot;Ciudad&quot; pueden agruparse en una entidad semántica llamada &quot;Dirección&quot;, que a su vez puede asociarse a la definición formal de dirección en una ontología. &lt;br /&gt;&lt;/p&gt;
&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/Imagen2stasis_max.jpg&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/Imagen2stasis_min.jpg&quot; alt=&quot;Ejemplo de relaciones entre conceptos&quot;/&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;El proceso de asociación entre conceptos se realiza mediante ontologías, en las que pueden definirse los conceptos como clases y pueden establecerse relaciones entre ellos (véase &lt;a href=&quot;http://www.wshoy.sidar.org/index.php?2005/12/09/30-ontologias-que-son-y-para-que-sirven&quot; hreflang=&quot;es&quot;&gt; http://www.wshoy.sidar.org/index.php?2005/12/09/30-ontologias-que-son-y-para-que-sirven&lt;/a&gt;). Asimismo, los conceptos pueden enlazarse con estructuras sintácticas. Por ejemplo, la clase de una ontología &quot;Memoria USB&quot; puede enlazarse al campo &quot;USB flash memory&quot; de una base de datos de una empresa, al campo &quot;Pendrive&quot; de la BD de otra empresa, al campo &quot;Memory stick&quot; de la BD de una tercera empresa…&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Las aplicaciones desarrolladas en STASIS permiten identificar entidades semánticas utilizados en una organización y luego relacionarlas semiautomáticamente con los conceptos utilizados en otra, considerando el significado de cada concepto y no sólo su sintaxis. Por ejemplo, en la figura de abajo, las herramientas de STASIS permitirían establecer relaciones entre los conceptos de dos bases de datos pertenecientes a distintas organizaciones. &lt;br /&gt;&lt;/p&gt;
&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/Imagen3stasis_max.jpg&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/Imagen3stasis_min.jpg&quot; alt=&quot;Relaciones entre conceptos&quot;/&gt;&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;Todas las entidades semánticas y sus relaciones creados en STASIS se almacenan en un repositorio distribuido entre iguales o &lt;em&gt;peer-to-peer&lt;/em&gt;, lo cual permite compartir reutilizar esos conceptos y relaciones. Hasta el momento, se ha conseguido que las aplicaciones de STASIS sean lo bastante “inteligentes” para proponer relaciones entre conceptos mediante el análisis y la reutilización de relaciones ya establecidas. &lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Las herramientas de STASIS se están probando en Europa y China en el sector de la automoción y del mobiliario porque ambos sectores se caracterizan por utilizar infraestructuras de comunicaciones y formatos de datos incompatibles entre sí. Esto aumenta los costes de hacer negocios electrónicos con otras empresas (proveedores, distribuidores, clientes) y ralentiza el lanzamiento de nuevos productos. Actualmente, STASIS ya permite a los participantes comerciales del proyecto construir comunidades abiertas donde se define y se comparte la semántica de la información intercambiada en sus dominios. &lt;br /&gt;&lt;/p&gt;
&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/Imagen4stasis_max.jpg&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/Imagen4stasis_min.jpg&quot; alt=&quot;Oportunidades de negocio que ofrece STASIS&quot;/&gt;&lt;/a&gt;&lt;/p&gt;</content>
</entry>
<entry xml:lang="es">
  <title>¿TIENEN LOS AGENTES INTELIGENTES CREENCIAS, INTENCIONES Y DESEOS?</title>
  <link rel="alternate" type="text/html" href="http://www.wshoy.sidar.org/index.php?2008/06/23/43-tienen-los-agentes-inteligentes-creencias-intenciones-y-deseos" />
  <issued>2008-06-23T06:46:41-04:00</issued>
  <modified>2008-06-23T06:46:41-04:00</modified>
  <id>http://www.wshoy.sidar.org/index.php?2008/06/23/43-tienen-los-agentes-inteligentes-creencias-intenciones-y-deseos</id>
  <author><name>Miguel Ángel Abián</name></author>
  <dc:subject>Web Semántica</dc:subject>
  <summary>Cuando se describen agentes de software, suelen utilizarse modelos que emplean conceptos como "creencia", "deseo" o "intención". También cuando se habla de ellos suelen usarse expresiones como "El agente de viajes desea que su cliente haga el viaje con pocos transbordos". En este artículo veremos la utilidad de los modelos basados en creencias, deseos e intenciones para describir entidades de software que realmente no tienen esos estados mentales. ¿O tal vez sí?</summary>
  <content type="text/html" mode="escaped">&lt;p&gt;Cuando se describen agentes de software, suelen utilizarse modelos que emplean conceptos como &quot;creencia&quot;, &quot;deseo&quot; o &quot;intención&quot;. También cuando se habla de ellos suelen usarse expresiones como &quot;El agente de viajes desea que su cliente haga el viaje con pocos transbordos&quot;. En este artículo veremos la utilidad de los modelos basados en creencias, deseos e intenciones para describir entidades de software que realmente no tienen esos estados mentales. ¿O tal vez sí?&lt;/p&gt; &lt;p&gt;Los agentes inteligentes son agentes de software con la capacidad de tomar decisiones racionales cuando se les presenta una elección. Si un agente inteligente tiene un objetivo (buscar información sobre física cuántica, por caso), tomará decisiones para seguir el curso de acciones que le conducirá a cumplir el objetivo. Una decisión racional sería, por ejemplo, buscar en la base de datos de tesis doctorales del Instituto Max Planck. &lt;/p&gt;

&lt;p&gt;Cuando se habla de agentes inteligentes o de sistemas multiagente suelen usarse términos como &quot;creencia&quot;, &quot;deseo&quot; o &quot;intención&quot;. Éstos proceden del modelo &lt;strong&gt;Creencia-Deseo-Intención&lt;/strong&gt; (CDI o, en inglés, BDI: Belief-Desire-Intention), que describe los agentes inteligentes mediante nociones cognitivas como las anteriores. El modelo CDI se basa parcialmente en las ideas del filósofo estadounidense Daniel Clement Dennett, quien defiende el enfoque intencional para explicar el comportamiento humano. En opinión de este filósofo, el comportamiento humano puede explicarse e incluso predecirse basándose en conceptos de intenciones (&lt;em&gt;intencionales&lt;/em&gt;): creer, temer, querer, desear, esperar… Dennet utiliza el término sistema intencional para referirse a entidades &quot;cuyo comportamiento puede predecirse por el método de atribuir creencias, deseos y perspicacia racional&quot;.&lt;/p&gt;

&lt;p&gt;El modelo CDI también se basa en la teoría del razonamiento práctico, propuesta por el filósofo estadounidense Michael Bratman. Esta teoría define un marco psicológico de sentido común para entender el comportamiento humano mediante creencias, deseos e intenciones, concebidos como planes parciales para realizar acciones concretas. A diferencia del razonamiento puramente lógico, el razonamiento práctico se orienta hacia las acciones (¿qué debemos hacer para conseguir algo?). Es innegable que el razonamiento humano es práctico, pues casi todas las situaciones con las que nos enfrentamos en la vida ordinaria requieren soluciones prácticas: en un viaje, nadie se plantea utilizar las ecuaciones de Euler-Lagrange del cálculo variacional para hallar el camino más corto entre dos ciudades. Lo práctico es consultar un mapa de carreteras o preguntar en una estación de trenes. &lt;/p&gt;

&lt;p&gt;Según Bratman, el razonamiento práctico se basa en dos procesos: a) decidir qué objetivos deben conseguirse (proceso de decisión o elección); b) elegir un plan para conseguirlos (proceso de búsqueda de medios para alcanzar el objetivo). Por ejemplo, cuando una persona cambia de trabajo es porque ha decidido previamente que quiere más dinero, menor distancia al trabajo, mayor categoría laboral, etc.; y que, para conseguir sus deseos, debe irse a otra empresa. &lt;/p&gt;

&lt;p&gt;En el modelo CDI, los agentes inteligentes se consideran sistemas intencionales.  Es decir, su comportamiento se explica considerándolos agentes racionales cuyas acciones están determinadas por sus deseos y creencias. Del mismo modo que decimos &quot;Elena trabaja en una multinacional porque quiere ganar mucho dinero&quot;, podemos decir &quot;El agente de compras trabaja con diversos proveedores en Internet porque quiere precios bajos&quot; o &quot;El robot evita los obstáculos porque quiere llegar lo antes posible a su destino&quot;. Más adelante abordaré si es legítimo asignar conceptos intencionales a los agentes. &lt;/p&gt;&lt;p&gt;&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://wshoy.sidar.org/images/DeseosAgentes/DeseosAgentes1_max.jpg&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://wshoy.sidar.org/images/DeseosAgentes/DeseosAgentes1_min.jpg&quot; width=&quot;350&quot; height=&quot;280&quot; alt=&quot;Esquema del modelo CDI&quot; /&gt;&lt;/a&gt;&lt;/p&gt;
&lt;br /&gt;

&lt;p&gt;En el modelo CDI, las &lt;strong&gt;creencias&lt;/strong&gt; representan el conocimiento que el agente tiene sobre el estado actual de su entorno, de sí mismo y de otros agentes. Se utiliza el término &lt;em&gt;creencia&lt;/em&gt; en lugar de &lt;em&gt;conocimiento&lt;/em&gt; porque las creencias de un agente pueden ser erróneas. Por ejemplo, si consideramos un agente para jugar al ajedrez, la posición de cada pieza es una creencia del agente. Tanto los agentes inteligentes como los humanos toman, para cumplir sus objetivos, decisiones basadas en sus creencias sobre el mundo; es decir, en las informaciones que sobre él tienen (&quot;El cielo es azul&quot;, &quot;El colesterol es malo para la salud&quot;, &quot;Cuando no se ven las isóbaras, es que las cosas no están claras&quot;, &quot;El cerebro es un órgano maravilloso: empieza a trabajar en el momento en que usted despierta por la mañana y no se detiene hasta que llega a la oficina&quot;, etc.). &lt;/p&gt;

&lt;p&gt;En un agente CDI, la racionalidad resulta imprescindible. Imagine que encarga a un agente comprar en Internet la película &lt;em&gt;Chelsea Girls&lt;/em&gt;. Si el agente tiene como objetivo comprar la película al precio más barato posible y &lt;em&gt;cree&lt;/em&gt; que puede conseguirlo en Amazon.com, comprarlo en Amazon sería una decisión inteligente. Si el agente decidiera comprarla en cualquier parte, en contra de su objetivo o de sus creencias, su decisión no sería inteligente o, por mejor decir, sería irracional. &lt;/p&gt;

&lt;p&gt;Los humanos y los agentes inteligentes tienen una gran flexibilidad en sus creencias: si descubren que son erróneas o incompletas pueden cambiarlas. Unos y otros disponen de reglas de inferencia que les permiten revisar sus creencias cuando se encuentran ante situaciones que contradicen las antiguas. Veamos un ejemplo: durante muchos siglos, los europeos creyeron que todos los cisnes eran blancos.  Cuando se encontraron cisnes así en Australia –bastante violentos, todo sea dicho de paso–, los europeos cambiaron enseguida esa creencia errónea y modificaron sus libros de lógica, ricos en expresiones como &quot;Todos los cisnes son blancos&quot;. (Hay excepciones a la flexibilidad de las creencias humanas, claro. Piénsese, por ejemplo, en &lt;em&gt;La sociedad de la Tierra plana&lt;/em&gt;: la tozudez humana puede vencer holgadamente a cualquier conjunto de pruebas empíricas.). &lt;/p&gt;

&lt;p&gt;Aparte de la mayor complejidad de las creencias humanas frente a las de los agentes, ambas difieren también en su codificación. Las humanas se codifican en nuestras redes neuronales; dependiendo de los estímulos externos, se generan más o menos dentritas (conexiones sinápticas) entre las neuronas. En los agentes inteligentes, las creencias se codifican mediante lenguajes lógicos y ontologías. Por ejemplo, la ausencia de una persona puede codificarse como la creencia (&lt;em&gt;Luis estaEnCasa ausente&lt;/em&gt;), donde &lt;em&gt;ausente&lt;/em&gt; es una constante que significa que la persona no está en casa o no está a la vista del agente y &lt;em&gt;Luis&lt;/em&gt; es una instancia de una clase &lt;em&gt;Persona&lt;/em&gt;.  Usar lenguajes lógicos y ontologías limita la riqueza expresiva de las creencias. &lt;/p&gt;

&lt;p&gt;Los &lt;strong&gt;deseos&lt;/strong&gt; de modelo CDI, también llamados metas u objetivos, representan determinados estados que el agente quiere producir en su entorno, en sí mismo o en otros agentes. Corresponden a tareas que el agente debe realizar y que se consideran lógicamente consistentes entre sí: &quot;buscar vuelo a Munich&quot;, &quot;ganar a las cartas&quot;, &quot;conseguir tablas en la partida&quot;, &quot;encontrar el precio más barato&quot;. Un deseo como &quot;quiero agua caliente&quot; es inconsistente con el de &quot;quiero agua fría&quot;; como sucede con &quot;quiero congelar la patata&quot; y &quot;quiero freír la patata&quot;, si sólo hay una. En lenguaje lógico, los deseos se expresan con expresiones como (conseguir (agua tieneTemperatura 20)) o (comprobar ((Luis estaEnCasa ausente) Y (luz esta apagada))). &lt;/p&gt;


&lt;p&gt;En el modelo CDI, las &lt;strong&gt;intenciones&lt;/strong&gt; son deseos que el agente se compromete a realizar (no todos los deseos pueden cumplirse, como bien sabemos los humanos). Son deseos muy intensos y limitados a los aspectos del entorno sobre los cuales el agente tiene algún grado de control. Un agente sólo tiene intenciones que considera posibles y que cree que puede lograr actuando de cierta manera. &lt;/p&gt;

&lt;p&gt;Los agentes no necesitan considerar todos los posibles efectos secundarios de sus intenciones. Por ejemplo, consideremos un agente que pasea por Soria en invierno y tiene como objetivo llegar lo antes posible a una determinada calle. De repente se encuentra que el río Duero le impide el paso. Si decide cruzarlo nadando, enseguida se encontrará empapado. Aunque el agente decida llegar como sea a su destino lo antes posible y, por tanto, esté dispuesto a mojarse y pasar frío, eso no significa que el agente desee sumergirse en aguas heladas. Que el agente se moje no es una intención: si no lo consigue, no lo volverá a intentar. &lt;/p&gt;

&lt;p&gt;Las intenciones dan lugar a cursos de acción –&lt;strong&gt;planes&lt;/strong&gt;– que el agente sigue en un intento de cumplir sus intenciones. Cuando un agente tiene una intención, su actividad se centra en ella. La influencia de la teoría de Bratman sobre el razonamiento práctico en el modelo CDI resulta bien visible ahora: las salidas del proceso de decisión son las intenciones; y las salidas del proceso de búsqueda de medios para alcanzar su objetivo son los planes, que se ejecutan mediante &lt;strong&gt;acciones&lt;/strong&gt;. Éstas provocan consecuencias que pueden cambiar las creencias, deseos, intenciones, planes y acciones del agente. Si las acciones del plan no le permiten conseguir su intención, intentará otro plan. &lt;/p&gt;

&lt;p&gt;Si consideramos un agente con un deseo como (conseguir (Ana beber agua), una intención podría intentarse con el siguiente plan:  &lt;/p&gt;

&lt;pre&gt;
(ir nevera)
(buscar botellaAgua)
(sacar botellaAgua)
(botellaAgua llevarA Ana)
(botellaAgua entregarA Ana)
&lt;/pre&gt;


&lt;p&gt;Como ejemplo de arquitectura de agentes inteligentes basada en el modelo CDI se puede citar JAM (&lt;a href=&quot;http://www.marcush.net/IRS/irs_downloads.html&quot; hreflang=&quot;es&quot;&gt;http://www.marcush.net/IRS/irs_downloads.html&lt;/a&gt;). En esta arquitectura, las creencias, deseos e intenciones de los agentes se representan explícitamente en el código del agente; y las intenciones del agente se determinan dinámicamente mientras se ejecuta, de acuerdo con las creencias, deseos e intenciones programados. &lt;/p&gt;

&lt;p&gt;En JAM, las creencias del agente se representan como hechos (FACTS) que se almacenan en un fichero de texto. Por ejempo, he aquí las creencias que podría tener un agente robot: &lt;/p&gt;
&lt;pre&gt;
FACTS:
   // creencias del agente
   FACT nombre_robot &quot;Ivan&quot;;
   FACT id_robot &quot;03536D&quot;;
   FACT estado_robot &quot;Correcto&quot;;
   FACT posicion_robot 10000 10000 0;
   FACT lugar_robot &quot;Habitacion3&quot;;
   FACT objeto_encontrado &quot;Falso&quot;;
   FACT objeto_entregado &quot;Falso&quot;;
   FACT destino &quot;Habitacion4&quot;;
&lt;/pre&gt;
 
&lt;p&gt;He aquí un ejemplo de intenciones (llamados GOALS en JAM) y planes (cursos de acción para intentar cumplir las intenciones) para el agente robot en JAM: &lt;/p&gt;
&lt;pre&gt;
PLAN: {
NAME: &quot;Plan05&quot;
GOAL: ACHIEVE recoger_destornillador
CONTEXT:
    FACT localizado &quot;destornillador&quot; $X;
    FACT localizado &quot;robot&quot; $X;
    FACT localizado &quot;caja_herramientas&quot; $Y;
BODY:
   EXECUTE print &quot;Coge el destornillador en&quot; $X “.\n”;
   ASSERT coger &quot;destornillador&quot;;
   ACHIEVE localizado &quot;robot&quot; $Y;
   EXECUTE print &quot;Deja el destornillador en&quot; $Y &quot;.\n&quot;;
   RETRACT coger &quot;destornillador&quot;;
   ASSERT depositar &quot;destornillador&quot;;
}
&lt;/pre&gt;
&lt;br /&gt;

&lt;p&gt;Con ASSERT se añaden nuevos hechos al conocimiento del agente. Con RETRACT se borran. CONTEXT especifica las situaciones para las cuales los planes son válidos. &lt;/p&gt;


&lt;p&gt;Algunos autores creen incorrecto utilizar términos como creencias o intenciones aplicadas a agentes, pues son estados mentales que los programas o las máquinas no pueden tener. Para algunos, asignar a un agente palabras como &quot;quiere&quot; o &quot;desea&quot; es una forma de animismo (reconozco que definir persona como &quot;aquel programa de computadora capaz de superar la prueba de Turing&quot; me parece animismo en estado puro, adaptado a los tiempos modernos). Acierten o no, lo cierto es que resulta útil emplear conceptos intencionales porque facilitan entender la estructura de los agentes y su comportamiento. &lt;/p&gt;

&lt;p&gt;En el campo de los agentes, los conceptos intencionales son metáforas y abstracciones que proporcionan maneras sencillas y familiares de describir, explicar y predecir el comportamiento de los agentes. El lenguaje cotidiano usa muchas metáforas (&quot;Carlos &lt;em&gt;funciona&lt;/em&gt; muy bien en el trabajo&quot;,  &quot;Carmen se encuentra en el &lt;em&gt;otoño de su vida&lt;/em&gt;&quot;, &quot;Sujete la &lt;em&gt;pata &lt;/em&gt;de la mesa&quot;, &quot;Dele a la &lt;em&gt;luz&lt;/em&gt;&quot;, &quot;Respete mis &lt;em&gt;canas&lt;/em&gt;&quot;, &quot;El televisor se &lt;em&gt;niega&lt;/em&gt; a funcionar&quot;), así que no es extraño que suceda lo mismo en el lenguaje informático y en el científico (&quot;Conecte el &lt;em&gt;ratón&lt;/em&gt; del ordenador&quot;, &quot;El agente se &lt;em&gt;comporta&lt;/em&gt; de manera errática&quot;, &quot;El sistema ha &lt;em&gt;caído&lt;/em&gt;&quot;, &quot;&lt;em&gt;Descargue&lt;/em&gt; un archivo de Internet&quot;, &quot;El fotón &lt;em&gt;sabe&lt;/em&gt; por qué rendija pasar&quot;). Las abstracciones han resultado también muy provechosas en la informática: los módulos, los tipos de datos abstractos, las clases y los agentes son abstracciones que nos evitan trabajar con código máquina o con lenguaje ensamblador. &lt;/p&gt;


&lt;p&gt;El investigador Yoav Shoham –que acuñó el término &quot;programación orientada a agentes&quot; en 1989 y ha intentado entenderlo desde entonces– pone el ejemplo de una computadora para explicar la utilidad del enfoque intencional en la informática: aunque puede conseguirse una descripción técnica de la computadora y de su sistema operativo, sería inapropiado recurrir a esas descripciones para explicar por qué aparece un menú cuando pulsamos un cierto icono con el ratón. Cualquier computadora es demasiado complicada para explicar cada operación que podemos realizar con ella. &lt;/p&gt;

&lt;p&gt;Shoham también contrasta el ejemplo de la computadora con el de un interruptor de la luz. Aunque admite que el interruptor es un sistema que puede describirse muy bien con nociones intencionales (&quot;El interruptor transmite corriente cuando cree que nosotros queremos que la transmita, y no en otros casos; apretar el interruptor es simplemente una manera de comunicar nuestros deseos&quot;), reconoce que esa descripción es absurda y quizás infantil.  A la pregunta &quot;¿Por qué aceptamos la descripción intencional de la computadora y rechazamos la del interruptor?&quot;, Shoham responde: &quot;La descripción intencional del interruptor no nos dice nada, porque esencialmente entendemos el mecanismo lo bastante para tener una descripción mecanicista y más simple de su comportamiento&quot;. &lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;a href=&quot;http://www.wshoy.sidar.org/images/DeseosAgentes/DeseoAgentes2_max.jpg&quot; title=&quot;Ampliar imagen&quot;&gt;&lt;img src=&quot;http://www.wshoy.sidar.org/images/DeseosAgentes/DeseoAgentes2_min.jpg&quot; width=&quot;350&quot; height=&quot;280&quot; alt=&quot;No siempre son útiles los modelos intencionales&quot; /&gt;&lt;/a&gt;&lt;/p&gt;</content>
</entry>
<entry xml:lang="es">
  <title>Lista de buscadores semánticos.</title>
  <link rel="alternate" type="text/html" href="http://www.wshoy.sidar.org/index.php?2008/06/16/42-lista-de-buscadores-semanticos" />
  <issued>2008-06-16T18:41:17-04:00</issued>
  <modified>2008-06-16T18:41:17-04:00</modified>
  <id>http://www.wshoy.sidar.org/index.php?2008/06/16/42-lista-de-buscadores-semanticos</id>
  <author><name>Emmanuelle</name></author>
  <dc:subject>Aplicaciones prácticas</dc:subject>
  <summary>Una pequeña nota para tener como referencia aquí­ una interesante lista de buscadores semánticos en español.

Se encuentra en: http://www.javi.it/semantic.html Página de lo más inaccesible, pero en fi­n, qué se le va a hacer, lamentablemente la mayorí­a de la gente interesada por la semántica no...</summary>
  <content type="text/html" mode="escaped"> Una pequeña nota para tener como referencia aquí­ una interesante lista de buscadores semánticos en español.

Se encuentra en: &lt;a href=&quot;http://www.javi.it/semantic.html&quot;&gt;http://www.javi.it/semantic.html&lt;/a&gt; Página de lo más inaccesible, pero en fi­n, qué se le va a hacer, lamentablemente la mayorí­a de la gente interesada por la semántica no es consciente de la importancia de la accesibilidad :-(

El apunte me lo ha pasado Martí­n Baldassarre :-)

Y eso es todo... Bueno, añado que en la lista no aparece, porque aún no se ha publicado el buscador semántico desarrollado por la Fundación Sidar y cuya beta espero poder anunciar tras el verano.
   &lt;div class=&quot;flockcredit&quot; style=&quot;text-align: right; color: #CCC; font-size: x-small;&quot;&gt;Blogged with the &lt;a href=&quot;http://www.flock.com/blogged-with-flock&quot; style=&quot;color: #999; font-weight: bold;&quot; target=&quot;_new&quot; title=&quot;Flock Browser&quot;&gt;Flock Browser&lt;/a&gt;&lt;/div&gt;&lt;!-- technorati tags begin --&gt;&lt;p style=&quot;font-size:10px;text-align:right;&quot;&gt;Tags: &lt;a href=&quot;http://technorati.com/tag/buscador&quot; rel=&quot;tag&quot;&gt;buscador&lt;/a&gt;, &lt;a href=&quot;http://technorati.com/tag/listas&quot; rel=&quot;tag&quot;&gt;listas&lt;/a&gt;, &lt;a href=&quot;http://technorati.com/tag/%20sem%C3%A1ntica&quot; rel=&quot;tag&quot;&gt; semÃ¡ntica&lt;/a&gt;&lt;/p&gt;&lt;!-- technorati tags end --&gt;</content>
</entry>
<entry xml:lang="es">
  <title>¿DE DÓNDE VIENEN LOS AGENTES DE SOFTWARE?</title>
  <link rel="alternate" type="text/html" href="http://www.wshoy.sidar.org/index.php?2008/03/03/40-de-donde-vienen-los-agentes-de-software" />
  <issued>2008-03-03T03:40:46-05:00</issued>
  <modified>2008-03-03T03:40:46-05:00</modified>
  <id>http://www.wshoy.sidar.org/index.php?2008/03/03/40-de-donde-vienen-los-agentes-de-software</id>
  <author><name>Miguel Ángel Abián</name></author>
  <dc:subject>Web Semántica</dc:subject>
  <summary>Los agentes de software serán parte de la Web semántica, pero no están restringidos a ella. Cada vez se usan más en aplicaciones de todo tipo: comercio electrónico, sistemas de telecomunicaciones, control de procesos industriales, búsqueda de información, control del tráfico aéreo, reingeniería de procesos, gestión de agendas, organización de correos electrónicos, etc. Puede que en el futuro no exista la Web semántica o que sólo haya "islotes" semánticos. Sea como fuere, los agentes están aquí para quedarse. En este artículo veremos de dónde viene la tecnología de agentes.</summary>
  <content type="text/html" mode="escaped">Los agentes de software serán parte de la Web semántica, pero no están restringidos a ella. Cada vez se usan más en aplicaciones de todo tipo: comercio electrónico, sistemas de telecomunicaciones, control de procesos industriales, búsqueda de información, control del tráfico aéreo, reingeniería de procesos, gestión de agendas, organización de correos electrónicos, etc. Puede que en el futuro no exista la Web semántica o que sólo haya &quot;islotes&quot; semánticos. Sea como fuere, los agentes están aquí para quedarse. En este artículo veremos de dónde viene la tecnología de agentes. &lt;p&gt;Cada vez más, se necesitan programas o aplicaciones flexibles, que sean capaces de anticiparse a las necesidades de los usuarios de sistemas informáticos y de adaptarse a ellas. Los agentes son una solución a esa necesidad. Un agente de software es una entidad autónoma de software que puede interaccionar con su entorno. James Hendler considera que los agentes de software no difieren mucho de los agentes humanos: &quot;… los agentes podrían encontrar posibles maneras de cumplir las necesidades de los usuarios y ofrecer al usuario elecciones para su realización. Del mismo modo que un agente de viajes podría darle una lista de varios vuelos que usted podría coger, o una elección entre volar o coger un tren, un agente de la Web podría ofrecer una lista de posibles maneras de obtener lo que necesita en la Web&quot;.&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Los agentes proceden de los campos de la inteligencia artificial (IA) y de la ingeniería del software (en particular, de la orientación a objetos). Desde un punto de vista conceptual los agentes proceden del modelo de actores concurrentes que propusieron Carl Hewitt, Peter Bishop y Richard Steiger en 1973. Los actores, directos predecesores de los agentes, fueron definidos por Hewitt en 1977 como &quot;objetos autocontenidos, interactivos y que se ejecutan concurrentemente, que poseen estado interno y capacidad de comunicarse&quot; y como &quot;agentes computacionales que tienen una dirección de correo y un comportamiento&quot;. Los actores se comunican mediante un intercambio de mensajes y llevan a cabo sus acciones concurrentemente (es decir, sus acciones pueden ejecutarse en paralelo, sin secuencias fijadas de antemano). 
La principal diferencia entre los actores y los agentes es que estos últimos suelen tener restricciones relacionadas con metas o propósitos.&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Las relaciones y las diferencias entre los objetos y los agentes se detallan en &lt;a href=&quot;http://www.wshoy.sidar.org/index.php?2007/05/08/38-los-trabajadores-de-la-web-semantica-agentes-agentes-inteligentes-y-agentes-semanticos&quot; hreflang=&quot;es&quot;&gt;http://www.wshoy.sidar.org/index.php?2007/05/08/38-los-trabajadores-de-la-web-semantica-agentes-agentes-inteligentes-y-agentes-semanticos&lt;/a&gt;. La ingeniería de software tiende a adoptar enfoques un tanto totalitarios: todo es un actor, todo es un objeto…&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Hay una fuerte relación entre los agentes y la IA: provienen del campo de la inteligencia artificial distribuida (IAD), que estudia métodos y técnicas para la resolución de problemas mediante la cooperación de diversas entidades distribuidas, autónomas e inteligentes. En la IAD se entremezclan dos disciplinas: la IA y los sistemas distribuidos. Un sistema distribuido es, según George Coulouris, &quot;un sistema en el que los componentes de hardware y/o software localizados en computadores en red se comunican y coordinan sus acciones intercambiando mensajes&quot;. Aunque usted no supiera qué es un sistema distribuido, seguro que ha usado alguno. Si no fuera así, no estaría leyendo esto, pues Internet y la World Wide Web son sistemas distribuidos.&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;En la IAD, la colaboración de unas entidades con otras produce comportamientos colectivos que resuelven problemas que serían irresolubles si se abordaran individualmente o que proporcionan soluciones eficaces en cuanto a tiempo, velocidad o calidad. Un ejemplo de inteligencia &quot;natural&quot; distribuida nos la proporciona una colonia de termitas: la colaboración entre ninfas, obreras, soldados y la reina permite la supervivencia de la colonia. Las termitas por separado no podrían sobrevivir (los soldados no pueden alimentarse por sí solos, la reina apenas puede moverse y las obreras no pueden defenderse); pero su cooperación les ha permitido existir desde hace millones de años en este planeta. Quién sabe, quizás sobrevivan al &lt;em&gt;Homo sapiens sapiens&lt;/em&gt;: en el gran libro de la evolución quedan muchas páginas por escribir.&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;La IAD consta de tres grandes ramas de investigación: los sistemas multiagente (que estudian sistemas en que un conjunto de agentes cooperan, coordinan y se comunican para conseguir un objetivo común), la solución distribuida de problemas (que estudia la solución de problemas mediante procesamientos descentralizados) y la inteligencia artificial en paralelo (que desarrolla métodos y algoritmos paralelos de IA). 
Dentro de la IAD, los agentes provienen de los sistemas multiagente, que son grupos de agentes autónomos, generalmente heterogéneos e independientes, que colaboran entre sí para conseguir ciertos objetivos; esta colaboración implica que cooperen, se coordinen y negocien unos con otros. En un sistema multiagente no hay un control global del sistema ni existe un lugar donde esté toda la información.&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Tal y como se menciona en &lt;a href=&quot;http://www.wshoy.sidar.org/index.php?2007/05/08/38-los-trabajadores-de-la-web-semantica-agentes-agentes-inteligentes-y-agentes-semanticos&quot; hreflang=&quot;es&quot;&gt;http://www.wshoy.sidar.org/index.php?2007/05/08/38-los-trabajadores-de-la-web-semantica-agentes-agentes-inteligentes-y-agentes-semanticos&lt;/a&gt;, no es imprescindible que los agentes del sistema distribuido sean inteligentes (esto es, que tengan algún tipo de inteligencia artificial); la propia &quot;inteligencia&quot; puede obtenerse de la cooperación entre agentes &quot;tontos&quot;. Este tipo de inteligencia se denomina &lt;strong&gt;&lt;em&gt;inteligencia social&lt;/em&gt;&lt;/strong&gt;, y es la empleada en los partidos de fútbol entre robots. En estos partidos, cada robot persigue dos metas bien simples: marcar gol y esquivar a los jugadores del equipo contrario.  La combinación de los comportamientos individuales para lograr dichos objetivos hace emerger un comportamiento social semejante al de cualquier equipo de fútbol humano, salvo en la celebración de los goles. Las colonias de termitas, mencionadas antes, son ejemplos biológicos de inteligencia social –al igual que las colonias de hormigas o de abejas–. En las colonias, cada individuo tiene unas metas individuales, programadas genéticamente, más complejas que las de los robots futbolistas.&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Los sistemas multiagente se enfrentan a varias preguntas: ¿qué lenguajes deben usar los agentes para comunicarse?, ¿cómo deben coordinarse los agentes para que consigan los objetivos del sistema?, ¿cómo pueden los agentes resolver los conflictos (de intereses, p. ej.) que pueden surgir mientras colaboran?, ¿qué relaciones sociales surgen en una comunidad de agentes?&lt;br /&gt;&lt;/p&gt;

&lt;p&gt;Gran parte de las propiedades y ventajas de los sistemas multiagente proceden de los sistemas de IA distribuida. Veamos algunas de ellas:&lt;br /&gt;&lt;/p&gt;

&lt;ul&gt;
 &lt;li&gt;&lt;strong&gt;Modularidad.&lt;/strong&gt; Según el &lt;em&gt;Dictionary of Object Technologies: The Definitive Desk Referente&lt;/em&gt;, la modularidad es &quot;la descomposición lógica de las cosas (por ejemplo, responsabilidades y software) en agrupaciones simples, pequeñas (p. ej., requisitos y clases, respectivamente), que aumentan las posibilidades de lograr las metas de la ingeniería de software&quot;. La programación modular simplifica el desarrollo de sistemas de software y reduce su coste. (Si quiere saber por qué la modularidad ganó la II Guerra Mundial puede consultar &lt;a href=&quot;http://www.javahispano.org/tutorials.item.action?id=25&quot; hreflang=&quot;es&quot;&gt;http://www.javahispano.org/tutorials.item.action?id=25 &lt;/a&gt; o &lt;a href=&quot;http://www.javahispano.org/contenidos/es/orientacion_a_objetos_11/&quot; hreflang=&quot;es&quot;&gt;http://www.javahispano.org/contenidos/es/orientacion_a_objetos_11/&lt;/a&gt;.)&lt;/li&gt;&lt;p&gt;

 &lt;li&gt;&lt;strong&gt;Bajo acoplamiento. &lt;/strong&gt;Suele utilizarse el término acoplamiento para designar la dependencia entre módulos o componentes de un sistema.  En un sistema de software de bajo acoplamiento, cada componente depende lo mínimo posible de los otros. En estos sistemas, los componentes pueden comunicarse a pesar de tener diseños e implementaciones muy distintas. Por el contrario, en un sistema de acoplamiento fuerte, los componentes están diseñados para trabajar estrechamente con otros y dependen fuertemente unos de otros. Por ejemplo, el controlador de una impresora tiene un acoplamiento muy fuerte con la plataforma en que se ejecuta: pasar de un PC a un Mac requeriría programar de nuevo el controlador.  El bajo acoplamiento de los sistemas multiagente se traduce en flexibilidad (si hay que modificar algún agente, los cambios apenas repercutirán en el resto de los agentes) e interoperabilidad (los agentes pueden trabajar juntos aunque hayan sido diseñados y programados independientemente). &lt;/li&gt;&lt;p&gt;

 &lt;li&gt;&lt;strong&gt;Fiabilidad.&lt;/strong&gt; Que un agente del sistema deje de funcionar no implica que los demás lo hagan. &lt;/li&gt;&lt;p&gt;

 &lt;li&gt;&lt;strong&gt;Eficacia. &lt;/strong&gt; Las funciones del sistema se pueden dividir en tareas repartidas entre los agentes, con lo cual se consigue paralelismo (los agentes trabajan a la vez en distintas máquinas). &lt;/li&gt;&lt;p&gt;

 &lt;li&gt;&lt;strong&gt;Flexibilidad.&lt;/strong&gt; Se pueden añadir y eliminar agentes dinámicamente, y éstos pueden tener diseños e implementaciones muy distintas. &lt;/li&gt;&lt;p&gt;

 &lt;li&gt;&lt;strong&gt;Independencia de la plataforma.&lt;/strong&gt; Los agentes pueden funcionar en distintas plataformas. Esta independencia está relacionada con el bajo acoplamiento de los sistemas multiagente. &lt;/li&gt;&lt;p&gt;

 &lt;li&gt;&lt;strong&gt;Velocidad. &lt;/strong&gt;Como los agentes que cooperan entre sí se ejecutan concurrentemente, aumenta la velocidad de ejecución del sistema en conjunto. &lt;/li&gt;&lt;p&gt;

 &lt;li&gt;&lt;strong&gt;Redundancia. &lt;/strong&gt;La utilización de agentes redundantes (es decir, que desempeñan una misma tarea) mejora la tolerancia a fallos del sistema.  &lt;/li&gt;&lt;p&gt;

 &lt;li&gt;&lt;strong&gt;Escalabilidad. &lt;/strong&gt;El sistema mantiene su eficacia cuando aumenta significativamente el número de usuarios del sistema. &lt;/li&gt;&lt;p&gt;
&lt;/ul&gt;

&lt;p&gt;Si bien los agentes proceden del campo de la IA y forman un subcampo relevante de ella, cada vez más en continua expansión, la IA no termina en los agentes. Los agentes no resuelven todos los problemas a los que se enfrenta la IA. A saber: comprensión automática de textos en lenguaje natural, traducción de textos, reconocimiento y síntesis automáticas del habla, construcción de sistemas capaces de pensar de manera original o creativa, introducción del sentido común en máquinas, fabricación de  sistemas de reconocimiento de rostros o de formas… Dirá el escéptico: &quot;¿No debería la IA resolver todos esos problemas antes de anunciar lo listos que son los agentes?&quot;. Pobre escéptico, porque con esa exigencia jamás habría visto un agente en su vida (ni en varias vidas, si cree en la reencarnación). Dudo mucho que algún lector llegue a ver una máquina que hable así espontáneamente: &quot;Sé que últimamente he tomado muy malas decisiones, pero puedo asegurarle que mi trabajo se normalizará. Todavía tengo gran entusiasmo y confianza en la misión, y quiero ayudarle&quot;. Hasta el momento, los agentes inteligentes trabajan en dominios muy limitados (la Web, bases de datos, colecciones de documentos, correo electrónico) y realizan tareas muy sencillas. Así, necesitan muy poca inteligencia y no tienen que enfrentarse a muchos de los problemas de la IA aún sin solución. &lt;br /&gt;&lt;/p&gt;

&lt;p&gt;¿Adónde van los agentes? Por ahora, a todas partes: cada vez hay más aplicaciones comerciales y académicas basadas en ellos. Si al final son sustituidos por otra tecnología (basada en &quot;siervos&quot;, por ejemplo), puede estar seguro de que oiremos frases como éstas: &quot;Todo es un siervo&quot;, &quot;La tecnología de siervos aumentará la productividad de las empresas&quot;, &quot;Los siervos abren la puerta a una nueva era de tecnología&quot;, &quot;Con los siervos, los usuarios no perderán el tiempo en tareas repetitivas&quot;… &lt;br /&gt;&lt;/p&gt;</content>
</entry>
</feed>