Llegar a información confidencial mediante búsquedas en Google

En un post anterior comentaba que la inteligencia competitiva está basada en una metodología y en una manera de acceder a la información basada en la ética y la legalidad. No obstante Google proporciona opciones de búsqueda con las que traspasar la línea de la ética y la posibilidad de llegar a informaciones de alto valor de la competencia debido a agujeros de seguridad de las empresas en sus servidores web.

Éstos son algunos ejemplos de búsquedas feas y poco éticas que se pueden llevar a cabo en Google:

  • site:competidor.es filetype:xls inurl:clientes
  • site:competidor.es inurl:ventas
  • site:competidor.es inurl:activos
  • site:competidor.es inurl:confidencial
  • site:competidor.es filetype:ppt (para presentaciones Power Point)
  • site:competidor.es filetype:doc

Otro método poco transparente es el de ir recortando la url a la que hemos llegado de derecha a izquierda navegando a través de los subdirectorios. Si no está capado el acceso podremos llegar a verdaderos “arsenales”.

Mi voluntad obviamente no es la de fomentar esta práctica sino la de alertar sobre este hecho, sobre estas posibilidades que están al abasto de cualquiera y que se llevan a cabo hoy día. Un aspecto clave en la gestión de la información estratégica es el de la seguridad de la información y documentación de la empresa, un hecho crítico más si hablamos de grandes empresas que manejan grandes volúmenes de información.

Propongo el ejercicio inverso, probar cualquiera de las “super-búsquedas” anteriores y sustituir el nombre de un competidor por el de nuestra empresa/organización. Seguramente encontremos documentos perfectamente publicables (notas de prensa, etc.) junto con informaciones que puedan ser un poco más delicadas. Es hora de actuar.

Existen varias opciones: eliminar las páginas del servidor o proteger el acceso a las mismas. En estas FAQ del W3C se explican los tres métodos de protección de las páginas y archivos así como diversas cuestiones relacionadas.

Profesionales de la información desde una visión de negocio

Cita

Librarians need to become business managers. If we take the business view, librarians are selling a product (knowledge and information) to a market (our users) that needs to be serviced effectively (the right product), efficiently (at the right time), and cost-effectively (at the right price).

Fuente: Knowledge Management in a Changing World

Caso de estudio: Vigilancia colectiva en la I+D (INRA, Montpellier)

A continuación presento la experiencia del INRA de Montpellier, consistente en la puesta en marcha de un servicio de Vigilancia aplicada a la I+D en materia de economía y sociología rural, dentro del contexto de una UMR (Unités mixtes de recerche) francesa y publicado en la revista Documentaliste (2006, vol. 43, núm. 2) Estas UMR se componen de un grupo de personas provinentes de diferentes organismos de investigación y que trabajan sobre una misma temática.

Este caso se centra específicamente en las unidades de Vigilancia, integradas por documentalistas y técnicos, centrándose en varios aspectos, como son:

1) Misiones del departamento de Documentación:

  • Que participará en la dinámica de los equipos científicos y favorecerá la interactividad y flujos de conocimiento
  • Hacer del departamento un servicio de animación e intercambio de conocimiento
  • Satisfacer las necesidades de información
  • Proponer servicios nuevos y de valor añadido

2) Perfiles:

Los documentalistas no pueden sustituir a los técnicos/científicos. Sus roles son complementarios. Los documentalistas aportan su saber hacer técnico, su conocimiento de las herramientas y estrategias de búsqueda y conocimiento de las fuentes de información. Tendrán, asimismo, la responsabilidad de adquirir unos ciertos conocimientos técnicos del ámbito de especialización del centro. Por otro lado, los técnicos validan los resultados y los contenidos de la vigilancia pudiendo ayudar a la comprensión de los conocimientos científicos.

3) Problemáticas:

Una de ellas será resolver las diferentes vías en que se presenta la información:

  • Internet
    • Bases de datos, webs…
  • Papel: Diarios, prensa, catálogos, artículos…
  • Comunicación informal: contactos,  profesionales.

4) Proceso:

  • Encuesta de necesidades
  • Prueba piloto con una unidad, a fín de reorientar la estrategia si fuera necesario
  • Formación de los grupos de vigilancia. Unidades mixtas de documentalistas/técnicos.

5) Difusión de la información:

Adaptada a los tipos de información y su ciclo de vida.

  • Boletín mensual: Newsletter en html, con referencias únicamente si existe acceso al texto completo
    • Referencia bibliográfica completa
    • Sistema de clasificación propio
    • Afiliación científica de los autores: Permite observar los laboratorios competidores o potenciales competidores
  • Alertas puntuales con referencias bibliográficas.
  • Anuncios de conferencias y call for papers. Alerta de oportunidades de comunicación en congresos.

Evaluación del servicio:

  • A cada boletín recibido los destinatarios devuelven un pequeño cuestionario sobre la pertinencia de la información señalando los documentos que han consultado y los que ya conocían.
  • Encuesta individual: A cada miembro del grupo. Permite evaluar la calidad del servicio (forma, contenido y utilidad).

Evolución de la interactividad, feedback:

El acercamiento entre documentalistas y técnicos se concreta mediante la integración de los documentalistas en las reuniones de investigación.

El impacto en el documentalista:

  • La vigilancia permite al documentalista concienciarse de que está en un contexto de equipo de investigación. Concepto del embedded librarian
  • Cada documentalista se especializa en una materia en función de sus conocimientos.
  • Gracias a este servicio, los documentalistas se orientan hacia funciones de valor añadido.

Hacia la gestión de conocimiento.

Constatación de que existe un flujo de conocimientos que se habrán de capitalizar y gestionar. Se captan informaciones del entorno pero se debe preservar la memoria, los conocimientos internos dentro de las mismas materias: competencias individuales, resultados de la investigación, buenas prácticas, etc.

Acceso:

Mise en place d’un service de veille collective pour la recherche: déroulement du projet, évaluation et perspectives

La serendipidad. Un factor a tener en cuenta en la vigilancia estratégica

¿Qué tienen en común América, las lunas de Plutón, la piedra de Rosetta, los rayos X, la penicilina, la viagra, el donut o el último material innovador: el grafeno?

La respuesta: todos nacieron fruto de un hallazgo inesperado, casual (¿o causal?) y pasaron a formar parte del conocimiento humano y nuestro día a día. Es la denominada serendipia, o serendipidad,

“un descu­brimiento afortunado que se produce sin planificación. Se da de forma inesperada, aparentemente por accidente o suerte del destino. Es encontrar algo bueno que no buscabas”

En un espacio informacional la serendipidad se da cuando exploramos un contexto lineal, saltando de nodo en nodo hasta que encontramos aquella información que nos es realmente pertinente. Eso si, no confundamos serendipidad con azar. La serendipidad es un azar orientado e inducido por la persona. Sagacidad, obertura, curiosidad, creatividad y perseverancia serán aliados que favorecerán el éxito.

Pasemos a un plano más concreto, nos sentamos delante de la pantalla en busca de información dentro de un portal, base de datos, directorio, etc., con el que podemos interactuar de diferentes maneras. Nos encontramos con tres posibilidades/situaciones a la hora de adquirir información:

  1. Búsqueda de una información que conocemos y a la que queremos llegar rápidamente.
    En este caso normalmente recurrimos al motor de búsqueda. Una forma de favorecer la serendipia es la asistencia y recomendación de términos a introducir en la búsqueda a la hora de iniciarla o redefinirla. Un ejemplo seria Scirus, y sus opciones de refinamiento de la búsqueda.
  2. Búsqueda de una información que no tenemos muy clara, definida, pero que en cuanto la tengamos delante identificaremos inmediatamente.
    El método más común es acudir a la navegación, o browsing. Navegaremos por la taxonomía del sitio hasta llegar a información que encontramos relevante. Hiperenlaces o herramientas de visualización nos ayudarán a llegar esta información deseada.
  3. Hallazgo inesperado, accidental de información. Serendipia.

Vista la importancia de esta forma de hallar información, en un sistema de inteligencia competitiva la gestión de esta serendipidad será otro elemento nada desdeñable a tener en cuenta, por lo que será importante establecer el procedimiento por el cual estas informaciones pasarán a formar parte del ciclo de información potencialmente estratégica y ser aprovechables para la toma de decisiones.

Este hecho será más importante, si cabe, si en nuestra organización utilizamos herramientas fuertemente automatizadas para la captura, tratamiento, almacenamiento y difusión de información.

¡Ojo!

Nos podemos ver atrapados por un software que nos ate de pies y manos y no nos permita gestionar otros canales o tipos de información como el caso que nos ocupa.

Más:

Serendipidad o casualidad buscada. Wikinnovación, Amalio Rey.
Serendipidad. Tomas Baiget.
Make serendipity work for you. Mark de Rond. Harvard Business Review.

Frases que nunca le dirás al profesional de la información de tu organización

Durante los años de experiencia un profesional va acumulando situaciones y anécdotas que se circunscriben a situaciones con compañeros de trabajo, clientes, usuarios, superiores, etc. Si a esto añadimos un ámbito profesional, como es el del profesional de la información, en ocasiones no demasiado definido y en constante situación de crisis de identidad y de utilidad a la sociedad, nos podemos encontrar con innumerables anécdotas y comentarios. A continuación he recogido algunas de estas frases que nunca le dirás al profesional de la información de tu organización:

 

  • “… Pero si en Google ya está todo…”
  • “… Tú no me vas a dar información de calidad porque no sabes de lo mio…”
  • “…En mi base de datos en Excel lo tengo todo…”
  • “…Yo ya hago mi vigilancia…”
  • “…¿Crear un portal de internet? Eso es para informáticos…”
  • “…Eres como un Sherlock Holmes digital…”
  • “…Las referencias bibliográficas producen frustración. Si no hay texto completo no vale…”
  • “…Con este software ya no necesitas nada más…”
  • “…Pero tú realmente ¿qué haces?…”
  • “…Me niego a que nadie busque información por mi…”
  • “…Nadie va a poder organizar la documentación interna…”
  • “…Los boletines la verdad es que casi ni nos los miramos…”
  • “…Tú que eres técnico en la materia, que serás una persona muy ordenada y que  te habrán enseñado muy bien a organizarte los papeles…”
  • “…Eso de los resúmenes es un rollo. Puedo acceder al proxy de la universidad y con mi password bajármelo todo…”
  • “- Si, es que se trata de una patente. – ¡Pero si está en inglés!. Dios mio, no sé cómo la vamos a traducir, el Sr. Director no entiende el inglés…”
  • “…Y para este proyecto, ¿Cómo lo hacemos? Montamos un Excel ¿no?…”

El Social curator, nuevo intermediario del conocimiento

Un nuevo término se está haciendo hueco dentro de los entornos de información digital y social últimamente: El Social curator (relacionado con el término Content curator), o Curador de contenidos sociales, término adaptado al castellano.

Este es un término -el Curator– tradicionalmente vinculado con las instituciones culturales (museos, bibliotecas, archivos, galerías) que hace mención a la gestión de colecciones y que se podría relacionar con el término Conservador. En el mundo online lo podríamos identificar con aquella persona encargada de seleccionar, filtrar, contextualizar, poner en valor y difundir información a una determinada comunidad.

¿Y dónde podríamos situar a esta figura dentro de la cadena de valor de la información?

En un mundo donde un 1%-2% crea contenidos, un 8%-9% los selecciona, contextualiza y distribuye y un ~90% lee el primer párrafo y salta al siguiente enlace, el curador se sitúa en ese casi 10% de la posición intermedia. Un grupo donde encontramos toda una serie de perfiles asociados a la mediación y gestión de la información de diversa índole: social, académica, económica, estratégica, marketing, etc. y donde cada día van apareciendo nuevos términos a cada cual más cool (Knowledge manager, Community manager, Social curator…) para designar en términos generales lo mismo: al profesional intermediario del conocimiento encargado de gestionar información con el objetivo de nutrir de informaciones de diversa índole a un comunidad objetivo. Una información basada cada vez más en términos sociales/humanos y menos algorítmicos.

En comparación con el perfil de Vigilante estratégico, encontraríamos algunas similitudes y diferencias:

1. En cuanto a su figura:

  • La figura del profesional de una unidad de Vigilancia/Inteligencia es una figura institucionalizada, se encuentra dentro de un organigrama corporativo, mientras que el Curador no tiene porqué tener necesariamente una vinculación con una organización.
  • El Curador respondería a la figura de especialista en una materia, mientras que el Vigilante lo haría más a la de figura multidisciplinar.  El Curador social es poseedor de unas claras competencias digitales globales. Resulta más imprescindible este conocimiento en su figura que en la del Vigilante. (¿Curador = Vigilante 2.0 en tiempo real?).
  • El Curador social es una figura a menudo influyente en su comunidad. Consigue ser un mediatizador a nivel social.

2. En cuanto a su objetivo:

  • El objetivo del Vigilante es el de nutrir de informaciones con un componente estratégico -informaciones de alto valor añadido para la toma de decisiones estratégicas- a la dirección de la organización o a alguno de los participantes en el sistema. El objetivo del Curador puede obedecer a otros motivos, como tratar informaciones alrededor de un topic en base a su impacto social, inmediatez o a cualquier otra motivación expresada por su audiencia.
  • En un entorno de Vigilancia/Inteligencia estratégica resultará más importante la información que se retiene. En comparación, en la Curaduría social existirá una mayor prioridad en cuanto a la transmisión de la misma a la comunidad.

3. En cuanto a su metodología:

  • El Curador se centrará más en señales fuertes del entorno, mientras que la prioridad del Vigilante será centrarse en señales débiles, señales que puedan suponer una alerta temprana para la organización y con la que anticiparse y crear una ventaja competitiva para la misma.
  • Ambos se centran en un trabajo en red. La diferencia es que en una comunidad tipo de Vigilancia/Inteligencia existirá un número mayor de perfiles con unas funciones a desarrollar determinadas, mientras que en la Curaduría el número de actores involucrados será menor: El Curador y su comunidad de destinatarios. Por tanto, mayor complejidad y flujos de información en la primera que en la segunda.
  • En la Curaduría social existe el riesgo de la credibilidad, fiabilidad, nula calificación o sesgos de las informaciones recogidas y las fuentes de información de las que provienen. Estas informaciones sociales que se transmiten con gran impacto pueden ser pobres en cuanto a calidad y pertinencia. En la Vigilancia estas informaciones tendrán que ser filtradas y depuradas en base a criterios como su prioridad, oportunidades/amenazas, relevancia, fiabilidad, credibilidad, etc.
  • En relación a esto, podríamos decir que existe una mayor instrumentalización e importancia de la gestión de la información en los procesos de Vigilancia que en los de Curaduría social.

Por otro lado, podríamos llegar a la conclusión que todos somos Curadores en mayor o menor medida, todos tenemos nuestros gustos, ámbitos de especialización, inquietudes, formación… y hacemos circular información segmentada y direccionada en gran medida. En un entorno de aumento exponencial de la información es imprescindible una tarea de selección, filtrado, editorialización y difusión de información dando lugar a un producto de valor añadido en la frontera de la vigilancia, la documentación, la curaduría, el periodismo y la gestión del conocimiento. En definitiva, la intermediación del conocimiento, lugar donde ejerce su labor el profesional de la información.

PatSnap – Completo servicio de búsqueda y análisis de patentes

PatSnap es un nuevo servicio de búsqueda y análisis de patentes destinado a tener un papel importante en este tipo de servicios de libre acceso a documentos de patente.

Respecto a sus principales características:

Cobertura: En primer lugar, en su versión gratuita nos ofrece la posibilidad de buscar en las bases de datos de la USPTO, EPO (tanto solicitudes como patentes concedidas) y solicitudes vía PCT. Primer gran punto a favor, ya que podemos ejecutar una búsqueda en las bases de datos más importantes de patentes de libre acceso de manera conjunta.

Búsqueda: La interficie principal nos ofrece la posibilidad de hacer una búsqueda sencilla, con una interfície tipo Google. Como este tipo de búsqueda sencilla es completamente irrelevante cuando buscamos en este tipo de documento, vamos a la búsqueda avanzada, la cual nos ofrece la posibilidad en primer lugar de hacer una búsqueda booleana sobre una serie de campos: Inventores, resumen, título, reivindicaciones (de manera conjunta o por separado), fecha de publicación, así como CIP (Clasificación Internacional de Patentes) y UPC (US Patent Classification). En segundo lugar, también podemos ejecutar una búsqueda extendida en modo comando, indicando los códigos de cada campo, de manera que podemos refinar tanto como deseemos la búsqueda.

A la hora de formular las ecuaciones de búsqueda en este tipo de base de datos es muy importante la posibilidad de introducir diferentes operadores de búsqueda: Truncamientos, operadores de proximidad, máscaras, etc. En PatSnap tenemos toda una variedad de operadores a nuestra disposición: Truncamientos, reemplazo de uno o una cadena de caracteres, asignación de pesos a los términos de búsqueda, etc., de manera que podemos precisar mucho más la búsqueda.

Reformulación de la búsqueda: Una vez ejecutada la búsqueda y con los resultados a la vista, una posibilidad que tenemos es la de refinar la búsqueda, es decir, ejecutar una búsqueda dentro de los mismos resultados obtenidos con el objetivo de llegar a resultados más concretos. Otra opción que tenemos es la de filtrar los resultados según una serie de facetas: Solicitante de la patente, año, inventor, CIP o tipo de documento.

Gestión de registros: PatSnap nos ofrece una completa variedad de posibilidades para gestionar los registros. Así, podemos crear una lista personal de registros, guardar búsquedas, recibir alertas de éstos vía correo / Rss, exportar o descargarnos el documento a texto completo.

Análisis: Uno de los aspectos que más me ha llamado la atención y que sin duda encuentro diferenciador de PatSnap son las grandes posibilidades de análisis estadístico de los resultados, sin duda las más completas frente a otros servicios gratuitos y con el añadido de que es un análisis conjunto tanto de patentes americanas, europeas como Wipo.

Así, tenemos la posibilidad de hacer un análisis de hasta tres variables de los resultados, enfocando en análisis a fechas, inventores, solicitantes, clasificaciones, geografía y mapa de citaciones. Tenemos acceso a tablas, diagramas de barras, histogramas, etc., pudiendo refinar los resultados dentro de estos mismos gráficos o descargarnos los gráficos en formato gráfico, pdf o Excel.

Como conclusión, PatSnap es un soplo de aire fresco dentro de las bases de datos de patentes de libre acceso gracias a sus grandes posibilidades de búsqueda, filtrado, gestión de registros o análisis, este último uno de los campos de mayor necesidad para las actividades de Vigilancia y terreno a explotar progresivamente por este tipo de servicio.

De momento, PatSnap se pone a la cabeza.

  • Una demostración de la búsqueda en la base de datos y sus opciones:

 

Explorando la web invisible con DeepPeep

DeepPeepLa llamada “Web invisible” o “Web oculta” es un concepto del que se viene hablando desde hace ya algunos años, refiriéndose a toda aquella información, que por una serie de motivos que dejaremos para otro día, no es indexable por los motores de búsqueda habituales y que, según estimaciones, es aproximadamente unas 500 veces más grande que la “web superficial”.

Realmente es una cifra impactante, sobretodo si tenemos en cuenta que en 2008 Google cifraba en 1 trillon la cantidad de URL’s únicas indexadas.

En este sentido, DeepPeep es un servicio en desarrollo que está dando pasos para acercar y hacer más accesible toda esta información oculta para los motores de búsqueda habituales y que resulta de gran valor sobretodo a la hora de buscar información científico/técnica. Su propuesta es la de localizar e indexar formularios de búsqueda que generan toda esta información dinámica no indexable, agruparlos mediante clústers y ejecutar una serie de búsquedas sencillas. Los resultados de estas búsquedas crean una idea del contenido de las bases de datos y hacen posible una selección de términos de búsqueda con los que extraer contenido relevante para el usuario.

De este modo, las opciones de búsqueda de DeepPeep son mediante una búsqueda sencilla, una mediante dominios (Auto, airfare, biology,book, hotel, job y rental) y una búsqueda “visual” mediante los clústers.

Ejecutando una búsqueda de prueba comprobaremos que los resultados nos remiten a fuentes de información típicos de la “Web oculta“: Catálogos de bibliotecas, bases de datos científicas, formularios de búsqueda de sitios académicos e institucionales, agencias, etc.

DeepPeep es un servicio en desarrollo, se hace evidente a la hora de explotarlo, y serían recomendables opciones como la de filtrado tras la búsqueda, un número mayor de dominios de conocimiento, o una orientación temática más específica de los mismos, sobretodo si se quiere utilizar como fuente de información científico/técnica.

Aún así, siempre resultan recomendables este tipo de iniciativas que nos amplían la visión y que nos hacen ver que “hay vida más allá de Google”.

DeepPeep es un proyecto de la University of Utah. Más información del proyecto aquí.

Para ampliar información:

Patentes: Y porqué no todo el monte es orégano

En mi anterior post analizaba una de las principales fuentes de información que tradicionalmente han estado ligadas a la Vigilancia tecnológica, como son los documentos de patente, títulos de propiedad industrial otorgados en base a tres criterios: Novedad, actividad inventiva y aplicación industrial.

Asimismo, sintetizando los puntos que comentaba en el anterior post, nos permiten plantearnos y ofrecer posibles respuestas a determinadas cuestiones:

  • ¿Quién ha hecho qué? ¿Con quién? ¿Están mis competidores / clientes / proveedores involucrados?
  • ¿Cuáles son las áreas emergentes de mi ámbito de actividad? ¿Quién interviene?
  • ¿Qué posibles repercusiones puede tener para mi nicho de mercado o modelo de negocio?
  • ¿Cuáles son los enlaces con mis anteriores informaciones? ¿Señales de cambio?

Realmente este es un tipo de información nada desdeñable como fuente de información tecnológica, jurídica y estratégica, y más teniendo en cuenta la democratización en cuanto a acceso que ha supuesto el surgimiento y mejoras día a día de las bases de datos de libre acceso (Espacenet, WIPO, Google Patents, etc.), y que, como señalaba Lara Rey a modo de comentario, en términos información contenida / € resulta rentabilísima como fuente de información.

No obstante, este es el lado bueno de este tipo de información, pero existen una serie de aspectos que conviene tener en cuenta a la hora de tratar con ellas. Y es que:

  • No todas las invenciones se patentan, ya que las empresas a menudo optan por estrategias alternativas para proteger, como por ejemplo el “lead time”: Salida rápida al mercado y mediante una fuerte campaña de marketing asociar el producto a una marca determinada. Se trataría, pues, de una protección indirecta.
  • La terminología utilizada en los documentos de patente. De carácter jurídico/legal, que aumenta la opacidad de la información contenida y por tanto su comprensión.
  • Contrainteligencia. Con la publicación de la patente (ya sea la solicitud o la patente concedida) está llegando una información valiosa a la competencia, con lo que se intentará ocultar o “disfrazar” en la medida de lo posible informaciones críticas.
  • Los requisitos para patentar varían según los países.
  • En relación, la “calidad” y “valor” varían enormemente. Se encuentran patentes con un posible retorno económico junto con otras de muy bajo valor.
  • Familias de patentes. En función de la fase de tramitación y la organización o país donde se tramite, una misma invención da lugar a varios documentos de patente. Esto es importante tenerlo en cuenta a la hora de analizar una muestra determinada ya que puede dar lugar a interpretaciones y análisis erróneos.
  • La propensión a patentar varia según el sector industrial y el tamaño de la empresa.