Minería y análisis de textos


Buscar información relevante sin saber exactamente lo que está disponible y lo que estás buscando

El análisis de textos, que es el siguiente paso en la tecnología de búsqueda, se refiere al proceso de extraer información no-trivial e interesante y conocimientos desde textos no estructurados. El análisis de textos de ZyLAB difiere de la búsqueda tradicional en que, mientras la búsqueda requiere de un usuario para saber lo que está buscando, el análisis de textos intenta descubrir información en un patrón que no es conocido de antemano. Esto se logra mediante el uso de técnicas avanzadas, tales como el reconocimiento de patrones, el procesamiento del lenguaje natural, el aprendizaje automático, etc. Al centrarse en patrones y características, el análisis de textos puede proporcionar resultados de búsqueda mejores y un análisis de datos más profundo, ofreciendo de este modo una recuperación rápida de información que de otro modo permanecería oculta.

Análisis de textos para obtener un índice alto de recuperación y precisión óptima

El análisis de textos de ZyLAB es particularmente útil en áreas en las que los usuarios deben descubrir nueva información, como investigaciones criminales, descubrimiento jurídico, y al realizar investigaciones de la diligencia debida. Dichas investigaciones requieren de un 100% de recuperación, ya que los usuarios no pueden permitirse el perder ninguna información relevante. En contraste, alguien que usa un motor de búsqueda estándar para buscar en Internet información de antecedentes, simplemente requiere que se recupere cualquier tipo de información, siempre que sea fiable. Durante la eDiscovery o la diligencia debida, un abogado o investigador tiene que revelar todas las posibles responsabilidades, no solo las más evidentes.

La tecnología de ZyLAB de análisis de textos está equilibrada con una amplia variedad de herramientas para refinar y filtrar resultados, clasificar por relevancia, deduplicar aciertos, buscar patrones, y evitar que los usuarios tengan que buscar entre un gran volumen de información irrelevante. Nuestra tecnología apalanca varias técnicas matemáticas, estadísticas, lingüísticas y de reconocimiento de patrones, que permiten analizar automáticamente información sin estructurar, así como la extracción de datos relevantes y de alta calidad.

Soporte de análisis de textos por ZyLAB

Entre los ejemplos de la minería de textos y análisis de textos ofrecidos por el software de ZyLAB están: resúmenes automáticos, extracción de expresiones regulares y entidades para más de 200 tipos de diferentes entidades (nombres, títulos de trabajos, compañías, direcciones, países, números de la seguridad social, números de tarjetas de crédito, fechas, pagos, cuentas bancarias y mucho más), búsqueda de eventos y hechos, extracción de conceptos, extracción de propiedades de documentos, extracción de propiedades de archivos, detección de archivos gráficos, reconocimiento automático de idiomas (también para mapas de bits con o sin OCR), y detección exacta y casi-duplicada. Los continuos trabajos de I+D de ZyLAB en minería de textos tienen como resultado más funcionalidad analítica para cada nuevo gran lanzamiento de nuestros sistemas.

Análisis de textos para colecciones multilingües

El análisis de textos de ZyLAB ofrece soporte para múltiples idiomas, lo cual es de importancia crítica cuando las investigaciones son globales e incorporan colecciones de información en varios idiomas. ZyLAB concilia las diferencias en los conjuntos de caracteres y palabras, pero también hace un uso intensivo de las estadísticas y propiedades lingüísticas (esto es, conjugación, gramática, sentidos o significados) de un idioma.

 

ShareThis