La historia de Watson, la computadora más inteligente del mundo

Hace 5 años, la compañía IBM se lanzó a diseñar un programa de computadora que fuera capaz de entender y responder preguntas de una forma similar a como lo hacen los seres humanos, es decir teniendo en cuenta la semántica del lenguaje.

El reto no era fácil. Las computadoras son capaces de responder cualquier pregunta siempre y cuando tengan la respuesta almacenada en su memoria. Pero la limitación más grande es la forma como se le hace la pregunta. Imagínate preguntarle a una computadora ¿Cuánto mide el continente Asiático? La computadora no tardaría en darte la respuesta (44,579,000 km2 ) Pero si por el contrario preguntaras ¿Por qué el continente Asiático es el mas grande del mundo? lo más probable es que la computador no pueda responderte, ya que esta respuesta implica una comprensión de varios conceptos paralelos que se relacionan entre sí. Por ejemplo la computadora debe “entender” el concepto de continente, debe también “entender” que hay más de un continente, que los continentes varían de tamaño, y que números de km2 determinan que un continente sea más grande que otro.

Las computadoras también fallan en reconocer las frases de doble sentido o las frases ambiguas que pueden tener más de una respuesta. Por años los investigadores han tratado de solucionar estas limitaciones alimentando las computadoras con reglas gramaticales, sin embargo los éxitos han sido muy limitados, dado que es imposible crear una regla gramatical para cada combinación de frases o palabras.

IBM se lanzó a crear su sistema con un enfoque completamente distinto. En vez de crear reglas gramaticales para incluir todas las combinaciones que una pregunta puede tomar, su sistema intentaría crear inferencias basadas en generación de hipótesis, que a su vez dependería de la recolección de evidencia, el análisis de la evidencia recolectada y la evaluación de probabilidad matemática de que la respuesta fuera la correcta. Cuando el sistema fallaba, aprendería de sus errores y buscaría los patrones erróneos que le llevaron a emitir la respuesta incorrecta. Una vez que estos patrones fueran identificados, el sistema sería capaz de eliminar el mismo patrón cuando se le presentaba una pregunta formulada de forma parecida a la que había fallado.

IBM llamó a su sistema “Watson” en honor al fundador de la compañía Thomas Watson.

Hardware

El primer paso fue crear un hardware que fuera capaz de guardar y analizar trillones de datos. Para esto IBM utilizó 90 servidores del modelo Power750 conectados entre sí. Cada servidor contenía 4 procesadores (CPU) de 8 cores. El total de memoria RAM llegó a los 15 TB. Watson era capaz de manejar 500 GB por segundo. Una vez encendido, Watson movía toda la información almacenada en sus discos duro a la memoria RAM, ya que este tipo de memoria es mucho más rápida el disco duro

Software

El software diseñado por los ingenieros de IBM se llamó DeepQA (Preguntas y Respuestas Profundas) y corría en el sistema operativo SUSE Linux Enterprise Server 11. Los programadores desarrollaron miles de algoritmos que funcionaban de forma independiente pero simultáneamente. Cada algoritmo estaba encargado de recolectar y analizar millones de posibles respuestas y cuando más de un algoritmo conseguía la misma respuesta, Watson le asignaba un alto a la respuesta. Todo esto sucedía en cuestión de milisegundos.

IBM cargó 4TB de data en los discos duros de Watson. Los datos incluían la Biblia, la Enciclopedia Británica, la base de datos de todas las películas que se han creado hasta el momento, incluyendo actores, directores y escritores. Además Watson fue alimentado con millones de páginas llena de datos históricos, culturales y hasta triviales para que pudiera usarlos como referencia cuando analizaba la posibilidad de que una respuesta era la correcta.

El reto

Cuando IBM buscó un medio para probar las habilidades de Watson, la idea más obvia fue Jeopardy, un popular juego de televisión donde 3 concursantes miden sus habilidades contestando una serie de preguntas en diferentes categorías, todo en un tiempo límite. Uno de los mayores retos de Jeopardy es la forma como se formula la pregunta. En vez de preguntar algo, el moderador del programa da la respuesta y el concursarte tiene que formular la pregunta. Por ejemplo el moderador diría “Es el continente más grande del mundo” a lo que el concursarte debía responder “¿Qué es Asia?

Jeopardy usa también una serie de palabras de doble sentido para confundir aún más al concursante. Por ejemplo si hay una categoría relacionada con el universo, el moderador podría preguntar: “es un planeta cuyo nombre está inspirado en el amor” cuya respuesta correcta sería ¿Qué es Venus?, ya que el nombre del planeta proviene de la diosa romana del amor.  Como debes imaginarte, este tipo de semántica es sumamente difícil de interpretar para una computadora.

Las pruebas iniciales comenzaron en el 2006. Watson se alimentó con 500 preguntas de los programas antiguos de Jeopardy para que tuviera un patrón de referencia. A pesar de esto, la computadora solo atinó a responder el 15% de las respuestas correctamente. El próximo año, IBM aumentó el personal que trabajaba con Watson con 15 ingenieros adicionales y ya para el 2008, Watson mostraba una capacidad de comprensión del lenguaje semántico muy similar a los seres humanos.

La prueba final

En día 14 de Febrero del 2011, Watson demostraría sus capacidades antes los dos campeones más grandes que Jeopardy jamás había tenido: Ken Jennings quien tenía el record de más juegos ganados y Brad Rutter el jugador con más dinero ganado en Jeopardy. El juego tendría 2 rounds y el ganador absoluto se llevaría 1 millón de dólares. IBM se había comprometido a donar el dinero a una entidad caritativa si Watson ganaba la competencia.

El primer round comenzó bien reñido, sin embargo hacia el final del juego Watson logró tomar ventaja y adelantaba a Jennings y Rutter en la cantidad de dinero ganado. Watson había logrado ganar $35,734, mientras que Rutter ocupaba el segundo lugar con $10,400 y Jennings tenía $4,800.

En la segunda vuelta, Watson se llevó nuevamente la victoria, acumulando $77,147 dólares mientras Jennings alcanzaba $24,000 y Rutter $21,600. y al final del juego llevaba ganado. Watson fue declarado el ganador absoluto y IBM se llevó el premio de $1 millón de dólares, mientras que Jennings se llevó $300,000 por ocupar el segundo lugar y Rutter $200,000 por obtener el tercer lugar.

El futuro de Watson

IBM ha dicho que su objetivo principal para su proyecto fue lograr crear una computadora capaz de entender las preguntas que los humanos le hacen de una forma natural, y a la vez proveer las respuesta de una forma que los humanos puedan comprender.

IBM y ha creado un acuerdo con Nuance Communication para desarrollar un proyecto comercial que utilice en plenitud las habilidades de Watson y esperan en los próximos 24 meses tener un producto comercial listo para el mercado. Por su parte investigadores de la Universidad de Columbia están analizando formas en las que Watson podría ayudar en la identificación y tratamientos de enfermedades. Otros posibles usos que IBM está estudiando es la posibilidad de usar a Watson en casos legales, donde la computadora podría usar sus recursos para analizar casos legales y dar recomendación a los abogados sobre el mejor curso a seguir.

Concluyo este artículo con un video de Watson participando en Jeopardy

Send to Kindle

4 Responses to “La historia de Watson, la computadora más inteligente del mundo”

  1. RAMON ESCOBAR

    Nov 12. 2014

    como puedo realaizarle preguntas desde mi computadora a la supercomputador watson.-

    Reply to this comment
    • admin

      Nov 25. 2014

      No está disponible al público. La están utilizando para investigaciones científicas.

      Reply to this comment
  2. melanie

    Sep 24. 2013

    hola, yo creo que es super genial esta computadora quiesiera tenerla!

    Reply to this comment

Trackbacks/Pingbacks

  1. Bitacoras.com - 2011/02/18

    Información Bitacoras.com…

    Valora en Bitacoras.com: Hace 5 años, la compañía IBM se lanzó a diseñar un programa de computadora que fuera capaz de entender y responder preguntas de una forma similar a como lo hacen los seres humanos, es decir teniendo en cuenta la semánti……

Leave a Reply