Búsqueda avanzada

Las capacidades de búsqueda más avanzadas para fines jurídicos e investigación

Ventajas de ZyLAB | Técnicas de búsqueda | Búsqueda difusa y comodín | Búsqueda jurídica

El motor de búsqueda de ZyLAB está optimizado para recordar lo máximo posible. En otras palabras, en vez de limitarse a encontrar el “mejor” resultado de búsqueda, un motor de búsqueda optimizado para ‘recordar’ encontrará cualquier cosa que pudiera ser relevante. Este nivel de minuciosidad es particularmente importante en las investigaciones intensivas de alto nivel.

Los 25 años que lleva ZyLAB realizando I+D intensivo en técnicas de búsqueda, han tenido como resultado un sistema que ayuda a los clientes a sacar el máximo partido de sus datos. Otros productos no son capaces de encontrar parte de su información o bien requieren que el usuario siga un costoso proceso de normalización de datos, o la creación de campos clave de forma manual, u otras formas de limpieza de datos.

Encuentre más información con ZyLAB – sin la carga de demasiadas “palabras vacías”


  • ZyLAB puede buscar datos textuales en más de 400 idiomas, en más de 700 diferentes formatos de archivos electrónicos, correo electrónico, multimedia y documentos en papel digitalizados.
  • Además de buscar y extraer contenido textual de documentos, ZyLAB también busca y extraepropiedades de archivo ocultas de los documentos. Esto ofrece una gran cantidad de información adicional en la que buscar.
  • Con la galardonada, robusta y ampliable búsqueda difusa de ZyLAB puede encontrar palabras a pesar de que estén mal escritas, con errores de escaneado, errores de Reconocimiento óptico de Caracteres (OCR), variaciones de traducción al convertir un nombre desde otro alfabeto, variaciones al escribir una palabra en jerga farmacéutica o al utilizar nombres químicos, errores tipográficos, y valores booleanos negociados en descubrimientos jurídicos.
  • El correo electrónico es un formato complejo, con correos electrónicos anidados dentro de otros correos electrónicos que incluyen aún más correos electrónicos, documentos, elementos de calendario, y tareas. Cuando use el Módulo de ZyLAB de Almacenamiento de Archivos puede buscar cada componente en un mensaje de correo electrónico, incluso los objetos incrustados más profundamente. Esto es posible gracias al Microsoft Exchange Connector y la herramienta de conversión de correo electrónico (PST, NSF o GroupWise a XML) incluida con el módulo.
  • Se pueden extraer, visualizar y buscar hilos de mensajes de correo electrónico y más de 100 propiedades de correos electrónicos.
  • ZyLAB puede identificar una diversidad de mapas de bits y aplicarles el Reconocimiento óptico de Caracteres en 200 idiomas (incluso con reconocimiento automático del idioma) para hacer que sean buscables. Estos mapas de bits se pueden buscar independientemente de que estén almacenados en un sistema de archivos o como archivos adjuntos en un mensaje de correo electrónico.
  • Incluso cuando una palabra no está presente en un documento o cuando está oculta en el documento o propiedades de archivo, el servidor de análisis de ZyLAB puede extraer los datos ocultos o ejecutar el texto de un documento con un extractor de conceptos para buscar nociones semánticas, extraer entidades y patrones complejos, o mostrar conexiones desconocidas entre personas, empresas, ubicaciones y eventos. A continuación se pueden usar todos estos datos extraídos para buscar, organizar, y clasificar documentos con más eficacia (ver también en la página Minería y análisis de textos).
  • ZyLAB ofrece etiquetado manual y herramientas para organizar documentos, tales como: mesas estáticas de contenidos, carpetas de búsqueda dinámica, árboles de conceptos jerárquicos, anotaciones, redacciones, sellos, hipervínculos, categorización, integraciones de bases de datos y campos clave manuales.
  • ZyLAB ofrece varias herramientas para personalizar el funcionamiento del motor de búsqueda, tales como: ‘palabras vacías’, identificaciones de símbolos, mapeados de caracteres, página de código y soporte Unicode, operadores traducibles, puntuación, y procesamiento de guión y apóstrofe. Los formatos de archivos no reconocidos y codificados se pueden detectar automáticamente y llevar a ubicaciones especiales para procesarlos más a fondo. Además, todos los aspectos del índice, extracción y procesos de búsqueda tienen funciones ampliadas de registro y auditoría.

Encontrar y gestionar la información tiene una importancia crítica, pero gestionar esa información tras encontrarla es igual de esencial. Ningún otro proveedor ofrece la gama de herramientas que ofrece ZylAB para gestionar y controlar todos los tipos de información, independientemente del formato.


ZyLAB ofrece las siguientes técnicas de búsquedapara ayudarle a encontrar lo que estaba buscando: Booleana-, proximidad (dirigida)-, frase-, difusa-, comodín-, concepto-, fecha-, campo clave-, propiedad del archivo-, propiedad del documento-, entidad-, progresiva-, quórum-, transliteración -, y búsqueda de rangos numéricos.

Además, hay varias herramientas disponibles de clasificación por relevancia, ayudas de búsqueda y navegación, tales como densidad de aciertos, ordenación por campos clave, aciertos resaltados, navegación por aciertos, vocabulario, historial de búsqueda, sinónimos, soporte de taxonomía, vista de campo clave en contexto (KWIC), refinar resultados (esto es, búsqueda por facetas), búsqueda por similitud, visualización avanzada de la lista de resultados (mapas de árbol, árboles hiperbólicos e integración con Google maps), federación (con el estándar de búsqueda abierta ATOM), integración con el motor de búsqueda de Internet (soporte de Sitemap.org), alertas automáticas y búsqueda de documentos en una tabla de contenidos.

Los extractores están disponibles como entidades, hechos, eventos, propiedades de archivo, propiedades de documento, campos clave, etiquetas HTML y XML, reconocimiento automático de idioma, resúmenes automáticos, traducción automática, categoría de documento, etc. Se puede encontrar más información en la página Minería y análisis de textos .

Búsqueda difusa y con comodín


Una búsqueda difusa localiza todos los aciertos de una palabra, además de las que se escriben de forma parecida a la palabra original. El grado difuso especifica el grado de similitud con la palabra original y ayuda a controlar la cantidad de resultados recibidos. La búsqueda difusa de ZyLAB está optimizada para detectar errores del Reconocimiento óptico de caracteres (OCR), y variaciones y errores de ortografía en nombres derivados de escrituras no románicas, como el cirílico, árabe, persa, hindú, hebreo, chino y japonés.

Una de las ventajas principales de los algoritmos difusos de ZyLAB es que su búsqueda difusa es independiente del idioma y la aplicación, y no es necesario "entrenarlos" como ocurre con muchos otros productos de la competencia. El motor de búsqueda difusa de ZyLAB tiene un alto grado de precisión, incluso con ajustes difusos elevados, y la diferencia de rendimiento entre los conjuntos de datos más grandes y pequeños es inapreciable. Incluso cuando el primer carácter de una palabra es diferente de una palabra de consulta, la búsqueda difusa de ZyLAB encontrará esa palabra. A diferencia de otros productos, la búsqueda difusa de ZyLAB permite que incluso el primer carácter sea diferente.

Además de la búsqueda difusa, ZyLAB también puede buscar con una amplia variedad decomodines sin que empeore la velocidad de búsqueda: ABC*, *ABC, A*C, e incluso *ABC*, están entre las posibilidades. Muchos otros motores de búsqueda no son capaces de hacer esto, especialmente la búsqueda *ABC. Estas técnicas son muy importantes para el cumplimiento de la ley y descubrimientos, ya que es virtualmente imposible enumerar todas las variaciones de las palabras mal reconocidas, mal escritas o prefijos y sufijos en palabras concatenadas y declinadas.


  • Soporte para búsquedas booleanas grandes y anidadas, búsqueda de proximidad y de quórum
  • Búsqueda difusa rápida (soportando los cambios del primer carácter) y búsqueda avanzada con comodín (a*, *a, a*a, y *a*)
  • Aciertos resaltados y navegación por los aciertos
  • Clasificación por relevancia reproducible y fiable
  • Indexación forense de archivos y propiedades de documentos
  • Reconocimiento automático del idioma
  • Capacidades de indexación para objetos compuestos, tales como correos electrónicos anidados, archivos comprimidos, colecciones de correos electrónicos, Microsoft SharePoint, bases de datos, y más
  • Auditoría e información de la indexación ampliada y el proceso de búsqueda
  • Indexación incremental de datos de red en vivo
  • Integración con la gestión de archivos, retención jurídica, identificación, colección, evaluación jurídica, producciones y procesos de redacción (TIFF)
  • Analítica de textos avanzada, categorización automática de documentos y traducción automática
  • Un motor de búsqueda mencionado en la actual ley de casos
ShareThis