Web Semántica en el campo de la medicina

En el campo de aplicación de las tecnologías de la información, la “semántica” tiene un significado más concreto y se refiere al conjunto de tecnologías que proporcionan una manera de representar el conocimiento de un dominio en términos entendibles tanto por humanos como por máquinas[1].

Este principio es el fundamento de la Web Semántica y los sistemas de software semánticos. Para implementar este principio, ha sido necesaria la creación de nuevos modelos, herramientas y formatos de almacenamiento de información. Es así como han surgido estándares como RDF[2] y OWL[3], que permiten representar en una máquina el mundo que nos rodea mediante estructuras de datos basadas en grafos.

La propuesta de la Web Semántica pretende reestructurar la web actual para agregar un nivel de abstracción mayor, de manera que, en lugar de conectar información mediante ligas de hipertexto, se puedan enlazar conceptos mediante relaciones con significado claro para el ser humano (figura 1). Estos conceptos tendrán asociados un conjunto de páginas HTML y recursos que aportan su significado o que se refieren al concepto.


Figura 1 - Visión de la Web Semántica


Con esta nueva capa de abstracción, y utilizando la semántica desde el punto de vista de las tecnologías de información, se puede dotar a las computadoras con la capacidad necesaria para realizar tareas de búsqueda eficiente, clasificación de información y descubrimiento de conocimiento nuevo. Todo esto, mediante un lenguaje entendible también para los seres humanos.

Un ejemplo claro de las ventajas de esta propuesta es la precisión en la recuperación de información mediante un buscador semántico. De este modo, si una persona busca la lista de “vuelos a Praga mañana por la mañana”, de acuerdo a la información que proporciona su contexto y el significado de las palabras vuelo, Praga, mañana y por la mañana, los resultados de la búsqueda serán más exactos y acordes a las necesidades de la persona (figura 2).


Figura 2 - Búsqueda en la Web Semántica


Obviamente, hablar de la Web Semántica no se trata de hablar de “una inteligencia artificial mágica que permita a las máquinas entender las palabras de los usuarios”, es sólo la habilidad de una máquina para resolver problemas bien definidos, a través de operaciones bien definidas que se llevarán a cabo sobre datos existentes bien definidos.

Para obtener esa adecuada definición de los datos, la Web Semántica utiliza esencialmente tres estándares para manejo de información en forma de grafos: RDF, SPARQL y OWL. Estos mecanismos ayudan a convertir la web en una infraestructura global en la que es posible compartir y reutilizar datos y documentos entre diferentes aplicaciones y usuarios.

La Web Semántica y la medicina

Aunque pareciera que la Web Semántica no tiene nada que ver con el campo médico, la realidad indica lo contrario. Por ejemplo, el Dr. Cimino expresa: “Un principio básico de la informática médica es que si los ordenadores han de ayudarnos en el proceso del cuidado de la salud, deben ser capaces de manipular información de forma simbólica y no sólo de almacenarla y regurgitarla”[4].

Tomando como base esta realidad, en el dominio médico se han hecho esfuerzos por formalizar el conocimiento de los expertos mediante ontologías que puedan ser explotadas por los sistemas y personas dedicadas al cuidado de la salud. Un ejemplo de ello es el trabajo de Javier Esquivias et. al. denominado “Representación del Conocimiento mediante Ontologías: Ensayo sobre Citología Tiroidea”[5], donde se expresa que el conocimiento que posee un patólogo sobre un diagnóstico es difícilmente transferible debido a dos cosas: a que este conocimiento está basado en su experiencia y a que la forma en que el patólogo lo comunica no es homogénea.

Lo anterior supone un problema de comunicación con otros patólogos interesados en compartir y enriquecer su conocimiento acerca de sus diagnósticos. En el trabajo de Esquivias se propone utilizar las ontologías como lenguaje común para representar y compartir este conocimiento en internet.

Otro esfuerzo con un enfoque distinto para la integración y recuperación de información médica es el UMLS (Unified Medical Language System)[6], que tiene como objetivo impulsar el desarrollo de sistemas que ayuden a los profesionales e investigadores en el manejo de información biomédica electrónica desde distintas fuentes. Esto permitirá el fácil enlace de sistemas de información dispares, incluyendo registros electrónicos de pacientes, bases de datos bibliográficas, bases de datos factuales y sistemas expertos.

El UMLS proporciona tres herramientas:
 

  1. Un metatesauro. Es una base de datos multipropósito y multilenguaje con información acerca de conceptos biomédicos y conceptos relacionados al cuidado de la salud. Esta base de datos incluye también los varios nombres de los conceptos y las relaciones entre ellos.
  2. Una red semántica. Es una colección consistente de categorías generales (tipos) y sus relaciones (relaciones semánticas). Esta red reduce la complejidad del metatesauro agrupando varios conceptos bajo un tipo.
  3. Un diccionario especializado y herramientas léxicas. Proporcionan mecanismos para explotar, enriquecer el metatesauro y generar aplicaciones de procesamiento de lenguaje natural bajo la sintaxis y semántica del dominio médico.


De la misma manera que UMLS, han surgido varios repositorios de información médica con el mismo propósito, como por ejemplo: MED (Medical Entities Dictionary)[7] que utiliza grafos conceptuales y un enfoque orientado a objetos; SOMED CT (Systematized Nomenclature of Medicine-Clinical Terms)[8] que concentra más de 311 mil conceptos activos, LOINC (Logical Observation Identifiers Names and Codes)[9], ICD9-CM (International Classification of Diseases, Ninth Revision, Clinical Modification)[10] y otros más.

El problema con la definición de todos estos repositorios es la integración y síntesis de información que se encuentra en medios y formatos heterogéneos, es ahí donde las ontologías y los estándares se vuelven un mecanismo poderoso de interoperabilidad.

Interoperabilidad semántica

Se entiende por interoperabilidad semántica a la capacidad de procesar de forma automática un conocimiento compartido entre sistemas heterogéneos. Actualmente, la interoperabilidad semántica es un problema que debe resolverse, pues es difícil compartir información médica entre distintas aplicaciones y entidades.

Con esto en mente han surgido organizaciones que se encargan de definir mecanismos de interoperabilidad mediante la generación de estándares para el intercambio, compartición, integración y recuperación de información relativa al cuidado de la salud. Un ejemplo de este tipo de organizaciones  es HL7 (Health Level Seven International)[11]. HL7 se fundó en 1987 como una institución sin fines de lucro y sus estándares son usados por más del 90% de los sistemas de información que prestan servicios para el cuidado de la salud; de la misma manera, cuenta con afiliados en todo el mundo.

Entre los estándares del HL7 destacan, por ejemplo el estándar HL7 CDA [12] y HL7 RIM [13], que tienen mucha relación con la definición de conceptos en una ontología.

El estándar CDA (Clinical Document Architecture) provee un modelo de intercambio de documentos clínicos y ayuda por lo tanto a la implementación de registros médicos electrónicos mediante el marcaje y definición de la estructura y la semántica de un documento clínico en formato XML.

El estándar RIM (Reference Information Model) es un estándar aprobado por el ANSI que constituye una enorme representación pictórica de los dominios del HL7 y define los ciclos de vida que los mensajes de información deben seguir. Esto es, define un modelo compartido entre todos los dominios que explicita las conexiones semánticas y léxicas existentes entre la información. Este modelo permite el intercambio de mensajes con información médica entre distintos sistemas.

Ontologías aplicadas

En el contexto médico existe ya un gran avance respecto a la estandarización de términos, sin embargo, no existe un vocabulario clínico universal, lo cual dificulta el intercambio de información médica entre expertos del dominio y aplicaciones de software. En este sentido, el uso de las ontologías puede ser aplicado para:
 

  • La unificación de términos locales respecto fuentes externas.
  • La integración de terminologías dispares para funciones comunes.
  • El desarrollo de aplicaciones clínicas basadas en estándares como los del HL7.
  • El desarrollo de mecanismos de intercambio de información entre aplicaciones de software existentes.
  • La construcción de buscadores semánticos para explotar la información médica y hacer el cruce de información de registros médicos, información sobre enfermedades y sobre diagnósticos.


Referencias:

[1] Berners-Lee, T., Hendler, J., Lassila, O.: The Semantic Web. Scientific American pp. 34--43 (2001).
[2] Consortium, W.W.W.: Resource Description Framework (RDF): concepts and abstract syntax. En línea (Febrero 2004), http://www.w3.org/TR/rdf-concepts/, visitado por última vez el 09-10-2010.
[3] Consortium, W.W.W.: OWL 2 Web Ontology Language Structural Specification and Functional-Style Syntax. En línea (Octubre 2009), http://www.w3.org/TR/owl2-syntax/, visitado por última vez el 09-10-2010.
[4] Lozano, R. Ontologías médicas. En línea http://www.forumcis.cat/Portals/1/SESSIONS/Sessions%2001-03/XavierPastor.pdf, visitado por última vez el 11-05-2011.
[5] Esquivias, J., Zurita, J.M., Gómez, M., Villar, E., Sánchez, J.M., Alonso, J.: Representación del Conocimiento mediante Ontologías: Ensayo sobre Citología Tiroidea. VII Congreso Virtual Hispanoamericano de Anatomía Patológica. En línea http://www.conganat.org/7congreso/PDF/211.pdf, visitado por última vez el 11-05-2011.
[6] U.S. National Library of Medicine. Unified Medical Language System. En línea http://www.nlm.nih.gov/research/umls/, visitado por última vez el 11-05-2011.
[7] Medical Entities Dictionary. En línea http://med.dmi.columbia.edu/, visitado por última vez el 11-05-2011.
[8] Systematized Nomenclature of Medicine-Clinical Terms. En línea http://www.ihtsdo.org/snomed-ct/, visitado por última vez el 11-05-2011.
[9] Logical Observation Identifiers Names and Codes. En línea http://loinc.org/, visitado por última vez el 11-05-2011.
[10] International Classification of Diseases, Ninth Revision, Clinical Modification. En línea http://www.cdc.gov/nchs/icd/icd9cm.htm, visitado por última vez el 11-05-2011.
[11] Health Level Seven International. En línea http://www.hl7.org/, visitado por última vez el 11-05-2011.
[12] Health Level Seven International.: Clinical Document Architecture. En línea http://www.hl7.org/implement/standards/cda.cfm, visitado por última vez el 11-05-2011.
[13] Health Level Seven International. HL7 Reference Information Model.

(Artículo publicado originalmente en la revista Develop Network No. 10 en su edición julio 2015)

Por Ing. Javier Solís González, Gerente de Nuevos Productos y Servicios en INFOTEC.


Comments

 

 

INICIA SESIÓN
Regístrate aquí
VIDEOS
JAVIER SOLÍS GONZÁLEZ

GALERÍA

¡ÉCHALE UN OJO A LAS IMÁGENES!

AQUÍ PODRÁS ENCONTRAR TODOS NUESTROS WALLPAPERS, INFOGRAFÍAS, ESQUEMAS Y MÁS.

LO MÁS VISTO