martes, marzo 15, 2016

Abramos más conjuntos de datos, porque ¿qué puede salir mal?

Nota: Este artículo lo escribí para el blog de la International Data Conference 2016. Podéis acceder al artículo original publicado el 16 de Febrero de 2016 en español Abramos más conjuntos de datos, ¿qué puede salir mal? y en inglés: Let’s open more datasets. What could go wrong?
En las conversaciones entre miembros de la comunidad de datos abiertos, en especial por parte de los responsables de proveer datos, es frecuente escuchar frases como “es necesario estimular la demanda de datos abiertos”, “no conseguimos llegar a los reutilizadores”, “sería interesante que los proveedores de datos y los reutilizadores hablasen más”. Estoy seguro de que habéis oído frases por el estilo en numerosas ocasiones.

Esta inquietud seguramente no es ajena a los organizadores del IODC, quienes deben ser conscientes de que las ediciones anteriores del evento han estado muy centradas en lo que suele llamarse el “lado de la oferta”, esto es en las organizaciones públicas encargadas de custodiar y proveer conjuntos de datos abiertos. Lo cierto es que en España, quizá por ser el Ministerio de Industria el encargado de promover las políticas de datos abiertos, siempre se ha fomentado que las empresas reutilizadoras hayan estado muy presentes en los eventos sobre datos abiertos. Y seguro que esto se notará en el programa de esta cuarta edición del IODC en Octubre.

Sin embargo, lo que me gustaría en este post es contaros un secreto que puede ayudar a entender por qué aparentemente no existe esa anhelada demanda de datos abiertos: Resulta que para las empresas reutilizadoras con frecuencia es más productivo obtener los datos de la web que utilizar portales de datos abiertos. Y es que, por desgracia, las tecnologías para la extracción de datos de documentos han avanzado en los últimos años con mucha mayor velocidad que la cantidad de conjuntos de datos en los portales.
 Y aunque no nos guste y sea muy poco eficiente, actualmente es el único camino posible en muchos sectores para que las empresas puedan generar valor a partir de datos. En otros sectores, directamente al no haber datos publicados ni en documentos ni en conjuntos de datos, no hay demanda que se pueda estimular. Las empresas, en especial las pequeñas, sobreviven con el valor que pueden crear y vender hoy, no de las promesas futuras.

Si fueseis una empresa, ¿dónde pondríais vosotros los recursos? ¿en una librería open source para mejorar un algoritmo de extracción de datos de pdfs o en participar en discusiones circulares acerca de la mejor forma de abrir datos?

A mí, como parte del “lado de la demanda”, me gustaría que el IODC 2016 fuese un punto de inflexión, no tanto para definir más estándares, más índices y más políticas y leyes, sino para obtener un compromiso de publicación de más conjuntos de datos útiles.

Si realmente se pretende fomentar la innovación y la creación de valor a partir de los datos abiertos propongo que se inunden los portales de conjuntos de datos útiles. ¿Qué puede salir mal? En realidad muchos de esos datos ya están dentro de documentos publicados en la web y se está desperdiciando mucho esfuerzo en extraerlos y limpiarlos cuando podría dedicarse a crear valor.

domingo, diciembre 23, 2012

Eder puede conseguir un futuro mejor con nuestra ayuda

Por desgracia, todos los años tenemos conocimiento de algún caso de persona, que como Eder, tiene graves problemas de salud cuya única esperanza de curación pasa por operarse en los Estados Unidos. Por supuesto, el coste económico de la operación suele ser completamente inalcanzable para una familia normal.

Lo que no es tan habitual es que esta persona pertenezca a tu entorno en vez de saber de sus problemas sólo a través de unos minutos en las noticias. Conozco a Eder Achútegui porque es sobrino de uno de mis mejores amigos y además tengo un gran aprecio por su padre y la mayor parte de su familia a quien he tenido la suerte de frecuentar desde hace más de 25 años.

La vida de Eder, desde que nació, ha sido una enorme lucha por adaptarse a su cardiopatía congénita que no le ha permitido disfrutar de las cosas sencillas que son tan importantes para nuestros hijos. Cosas como correr, saltar y jugar. Por eso cuando su familia supo que existía una posible solución en Boston se volcaron para conseguir los recursos económicos que eran necesarios. Al fin y al cabo las familias se endeudan de por vida por una casa, ¡qué no hacer por la salud de un niño!.

Su caso está descrito en el blog de Eder y ha tenido la atención de los medios y la ayuda de varias asociaciones como podéis ver a través de su blog. A pesar de todo, para que Eder pueda ir a su segunda operación en verano de 2013, todavía es necesario recaudar una importante cantidad de dinero para alcanzar los más de 88.000 $ en que está presupuestada.

Como os podéis imaginar, los bancos no dan facilidades para financiar estos casos, y nuestra sanidad pública tampoco aporta nada así que sólo nos queda movilizarnos individualmente para ayudar al margen de las instituciones. Por fortuna vivimos en un momento en el que todos podemos conectarnos entre nosotros sin ninguna necesidad de intermediarios gracias a la web y a todas las herramientas que se han construido sobre esta magnífica plataforma que está cambiando nuestro mundo. Por mi parte he donado los derechos de autor de 2010 y 2011 de mi libro "Web 2.0: una descripción sencilla de los cambios que estamos viviendo" para ayudar un poco. Y haré lo mismo en años sucesivos.

Estas son algunas de las posibilidades con las que podemos colaborar para conseguir que Eder tenga una vida mejor. La mitad ya está conseguida y en manos de todos nosotros está que pueda viajar hacia una segunda operación que le reconstruya el corazón y le ofrezca una mejor calidad de vida. Viendo lo que ha mejorado con la primera operación vale la pena el esfuerzo:
  • Comprar el libro "Diez Cuentos para Eder" que ha escrito su abuela y querida profesora mía.
  • Para quienes viváis en Burgos o en Soria, estar atentos a las decenas de actividades que está organizando su familia. Podéis seguirlas en el blog de los amigos de Eder
  • Recoger tapones rígidos. En Valladolid, podéis traérmelos a mí que se los llevaré encantado a Burgos a su familia.
  • Comprar mi libro "Web 2.0: Una descripción sencilla de los cambios que estamos viviendo", cuyos derechos de autor seguiré donando a Eder.
  • O simplemente hacer una donación en las cuenta bancaria que ha abierto su familia en  Triodos Bank: 1491-0001-23-2021988627

martes, agosto 07, 2012

Alberto comienza su vida

Hoy ha nacido Alberto, nuestro tercer hijo y como mandan los tiempos el primer anuncio ha sido a través de Twitter. A las 16:23 del día 7 de Agosto de 2012 nos hemos convertido en familia numerosa y tanto él como su madre ya están descansando. Y es que nacer no es nada fácil.

Lo más destacado en las noticias es que hoy ha llegado el primer oro para España en los Juegos Olímpicos de Londres 2012 y además ha llegado acompañado de 2 medallas de plata. El resto de cosas que se leen estos días espero que no sean recordadas si no es para que no vuelvan a repetirse.

Es casi seguro que 2012 no será recordado como un gran año en España, pero para nuestra pequeña familia 2012 siempre será muy especial. Deseo además que pueda desarrollar su vida en un país mejor, aunque probablemente no será este.

miércoles, febrero 15, 2012

Lo importante de la Licencia Open Data europea es que exista, no cuál será la licencia elegida

Update: I have published an English version of this post at Open Economy blog: "The important thing about the EU Open Data License is not which License will be selected."

Con frecuencia he escrito acerca de la sana envidia que me produce ver cómo la comunidad open data del Reino Unido trabaja para ser un referente a nivel global. El propio Primer Ministro David Cameron está liderando una ambiciosa agenda Open Data con el fin de impulsar la economía digital británica. Con la misma frecuencia he sido muy crítico con el inmovilismo de nuestros líderes políticos en temas de gobierno abierto en general y con la escasa utilidad de las iniciativas open data que se han ido lanzando en España.

Sin embargo algo parece que está cambiando. Esta vez, tengo que decir que estoy muy orgulloso de la Comunidad Open Data española por el liderazgo que está ejerciendo en el apoyo a la campaña por la licencia Open Data única en la Unión Europea. Como sabéis, con motivo de las negociaciones en el Consejo Europeo para la revisión de la Directiva RISP, hace unos días, Andres Nin en su blog, inició una campaña para solicitar que se incluya en dicha directiva un modelo de licencia único para todos los datos públicos que se liberen en la UE. En estos días se han sumado más de 330 apoyos, algunos tan relevantes como el del mismo Patxi López, lehendakari del Gobierno Vasco. Y seguro que se unirán muchos más. 


Como sabéis, yo sumé mi apoyo porque creo que una licencia única europea es muy importante para el desarrollo de compañías Open Data como Euroalert.

Sin embargo, durante esta semanas en las que he estado siguiendo la campaña y apoyándola todo lo que he podido he tenido la oportunidad de conocer las reticencias de algunas personas y organizaciones relevantes de la comunidad open data europea. Sobre todo se refieren a discusiones acerca de cuál sería la licencia elegida o a que sería mejor incluir una definición Open Data en lugar de sólo una licencia.

En mi modesta opinión no creo que sea importante en este punto decidir cuál es la licencia más apropiada ya que existen un buen número de licencias que cumplirían perfectamente el propósito.
"Lo realmente importante es que la licencia Open Data sea única en toda la Unión Europea para fortalecer el mercado único"
Y me preocupa mucho que este detalle esté haciendo perder fuerza a la campaña. Sería francamente triste que los intereses por imponer una u otra licencia hagan que se pierda esta oportunidad. Apoyemos que se considere incluir una licencia única en la Directiva RISP y después trabajemos para que pueda ser tan sencilla como la licencia que proponía Alberto Ortiz en su blog. Ojalá pudiese ser así de sencilla.


viernes, febrero 03, 2012

Una licencia open data única es muy importante para las empresas

Update: I have published an English version of this post at Open Economy blog: "A single Open Data licence is very important for companies"

Como todos sabéis en Euroalert estamos trabajando en el apasionante reto de construir una plataforma pan-europea que agregue los concursos públicos y licitaciones de todas las administraciones públicas de los países de la Unión Europea. Hace unos meses, a raíz de mi ponencia en la Primera Asamblea de la Agenda Digital os hablé de lo importante que resultaría una licencia "open data" única que fuese empleada por todos los países de la Unión.

La Comisión Europea se encuentra en estos momentos revisando la directiva del año 2003 sobre Reutilización de Información del sector público, cuya borrador de revisión publicó en diciembre. Por tanto existe una gran oportunidad de que al menos a nivel europeo se establezca un modelo de licencia open data único, si bien lo ideal sería que la licencia fuese única a nivel mundial.

Os pongo un ejemplo práctico para reflexionar sobre el tema. En Euroalert agregamos datos de fuentes muy diversas con licencias de lo más heterogéneas, inspiradas en las legislaciones de países diferentes y no siempre compatibles entre sí. En ocasiones nos han pedido, sobre todo desde organizaciones no-gubernamentales, bases de datos agregadas para la realización de estudios u otros proyectos. Aunque habríamos donado esos datos gustosamente, no hemos podido hacerlo porque es frecuente que las licencias prohíban la mezcla con otras bases de datos, la utilización comercial o expresamente cualquier tratamiento que no sea la publicación tal cual la obtenemos.


Sólo estudiar las implicaciones legales que podría tener el hecho de redistribuir bases de datos agregadas en crudo es algo que no hemos podido permitirnos. Nuestro deseo de publicar un nodo Linked Data con datos contratación pública se enfrenta a un problema similar que se solucionaría con una licencia única.

Ayer Andres Nin lanzó la iniciativa "Say to @neeliekroesEU we want a single #opendata licence in the #EU" en Actuable para pedir que se tenga en cuenta esta necesidad. Es clave para el desarrollo de las compañías que pretenden crear riqueza a través de iniciativas pan-europeas de reutilización de datos públicos. Y una oportunidad más para el desarrollo de un mercado único en el que operen compañías powered by open data entre las que se encuentra Euroalert. Os animo a que firméis la petición para la Comisaria Europea Neelie Kroes y a que le deis toda la difusión que os sea posible a ver si conseguimos que la voz de la Comunidad Open Data se oiga en las Instituciones Europeas.

domingo, enero 22, 2012

¿Cómo usa Euroalert los Portales Open Data españoles?

La semana pasada tuve la suerte de pasar un par de días en Granada con motivo de la Open Source World Conference 2012, donde fui invitado junto a otros open data warriors como Alberto Ortiz, Marc Garriga, Jorge Campanillas o Emilio García.

En el blog de euroalert han hecho un resumen estupendo de las dos mesas redondas en los que participé tanto en la OSWC2012 como en el Día del W3C en España, y en el hashtag #diaw3c podéis leer la interesante conversación que se generó en twitter a partir de las ponencias.

Pero lo que yo os voy contar es lo que creo que fue mi principal aportación al debate. En el último año y pico hemos asistido al lanzamiento en España de un buen número de iniciativas open data desde las diferentes administraciones públicas hasta hacer un total de 16 en toda España. Por ello decidí hacer un pequeño ejercicio práctico desde nuestro punto de vista como empresa que reutiliza datos ya que potencialmente Euroalert debería sacar gran partido a estas iniciativas. Más o menos tenía claro cuál iba a ser el resultado porque como os podéis imaginar cada vez que se lanza una nueva iniciativa desde Euroalert revisamos si cada portal open data contiene datos reutilizables de contratación pública.

Aunque se trataba de un ejercicio un tanto arriesgado teniendo en cuenta que en ambas sesiones iban a estar sentados responsables de los portales open data analizados creí que podía ser un  ejercicio útil para todo el mundo y que nadie debía molestarse. Y así fue. Todos sabéis que nada está más lejos de mi intención que molestar a nadie. Tan sólo pretendo remover alguna conciencia para poner un granito de arena con el fin de que mejore el panorama open data. Más o menos lo mismo que hacemos con el proyecto ShowMeTheTenders.net.

Aclarado esto, os dejo aquí el cuadro que representa la utilización de los portales open data españoles por parte de Euroalert. Consideramos útiles para nuestra actividad aquellos que publican diariamente datos de contratos públicos en cualquier formato que puede procesarse de forma automatizada y siempre que los conjuntos de datos tengan una estructura que vaya un poco más allá del título y la fecha de publicación.


Las conclusiones parecen claras, para Euroalert los portales open data españoles por el momento no tienen una gran utilidad. Dado que el sentir general de numerosas personas con las que he tenido ocasión de hablar el último año sobre la utilidad de los portales open data es más o menos el mismo, decidí terminar mi presentación realizando una sugerencia atrevida, y que no es otra que pedir que se llenen de datos los portales.


Porque en el fondo, los datos públicos deben ser considerados infraestructura, que es el mensaje que quise dejar para la reflexión:


A partir de ese momento, con los portales llenos de datos, esto es, con infraestructura disponible, podremos comenzar a aprender lecciones, medir sectores económicos, corregir licencias y valorar el retorno de la inversión. Lo que está claro es que si no hay datos es imposible que exista reutilización.

También os traslado la propuesta de Alberto Ortiz, que nos pidió a todos los presentes que diésemos un paso más. Que buscásemos un compromiso para dar un paso hacia adelante. Como os he contando en alguna ocasión, a mí me da mucha envidia la actividad del movimiento open data británico, y creo sinceramente que en España también tenemos materia prima para estar en la vanguardia. Pero la gran pregunta es, ¿quién liderará ese paso al frente? Yo desde luego me apunto.

Por otra parte, en Granada también pude ver una magnífica conferencia de Nicolas Negroponte centrada en el  nuevo OLPC XO-3 Tablet y en las lecciones que han aprendido con ese maravilloso proyecto One Laptop per Chilid que como os he contado alguna vez ha sido el primer ordenador de mis hijas. Pero lo de la conferencia os lo cuento otro día.