Content on this page requires a newer version of Adobe Flash Player.

Get Adobe Flash player

Recientes del blog

l10n

July 11th, 2016 | Opinión, Proceso inverso

La gestión de fechas, del calendario, en la informática, no es difícil, pero
sí es laboriosa. Hay diferentes zonas horarias en el mundo, bastante más que
asientos en muchos organismos mundiales [1]. Extremo ejemplo es Indiana, en
donde según qué criterios se consideren hay entre tres y ocho zonas horarias
diferentes [2]. El manejo del tiempo es más complicado que simplemente la
posición en la tierra de cada lugar, ya que los colectivos humanos
arbitrariamente tomamos la decisión política de cambiar la hora,
frecuentemente; y la fecha, aunque esto pasa mucho menos. Esta realidad a la
que la informática tiene que adaptarse deja trazas en repositorios de datos y
código públicos [3]. La gestión de calendarios es aún más complicada [4]
que lo expuesto por motivos que escapan al ámbito de este texto.

Cualquier tratador de datos puede confirmar lo diferente entre el
funcionamiento de las máquinas y los entornos de información imperfecta,
desorganizada, o sujeta a cambios arbitrarios. En el tratamiento de datos la
pureza formal de las matemáticas y sus aplicaciones prácticas choca
habitualmente con la naturaleza de la vida, con la impredecibilidad de la
aparición y detalles y consecuencias de una mutación en una reproducción, o
con la posibilidad de que la voluntad actúe en contra de una predicción. El
caos similar al que ocurre en la gestión del tiempo del que escribimos en el
párrafo anterior se reproduce fractalmente en muchos ámbitos sobre los que
la humanidad ejerce acción, por ejemplo a nivel colectivo en la península
ibérica respecto a varios asuntos… en su medida correspondiente.

En un modo parecido a las decisiones arbitrarias (en el sentido de la
impredecibilidad, sin valorar la justificación que el poder tuviera en el
momento) e históricas que se han tomado políticamente desde la antigüedad en
todo el mundo sobre la hora, la fecha y el calendario, existen arbitrariamente
múltiples formas correctas de referirse a las entidades geográficas a todos
los niveles en todos los ámbitos humanos. Con nuestro afecto por el anarquismo
(en su sentido amplio) generamos continuamente casos de multiplicidad de
grafías aceptadas para los nombres de los lugares [5]. Esto afecta de un modo
u otro a las tareas resueltas por máquinas.

Existiendo además múltiples identidades colectivas que se solapan
geográficamente a otras más generales y comunes, se suman posibilidades a la
forma de referir lugares [6]. En este punto entendemos que la problemática
obliga a aplicar técnicas de consideración por similitudes y a la pérdida de
importancia de unas palabras sobre otras, pero el problema da giros inesperados
debido a casos como que existan lugares como [7] que por nombre tienen una
palabra que en algunas lenguas (otra circunstancia a considerar) es un
artículo definido. Típicamente los artículos pierden importancia al hacer
búsqueda por similitud.

También hay casos en los que los nombres de dos lugares existentes contienen
las mismas palabras [8] pero en distinto orden [9]. Esto requiere la toma en
consideración del orden de palabras. Pero en la búsqueda en texto por
similitudes hay frecuentemente motivos que promueven que el orden no sea
importante.

En Madiva nos dedicamos entre otras muchas cosas a la búsqueda de conocimiento
a partir de datos de diversas fuentes, entre ellas las que proporcionan
ministerios y agencias gubernamentales. La naturaleza imprecisa y combativa de
nosotros con y contra nuestros vecinos y colegas añade otro efecto
multiplicador a este problema debido a las dificultades de coordinación y
falta de homogeneidad de criterios entre administraciones públicas, esto no
facilita la relación entre ficheros de datos provenientes de diferentes
organismos oficiales.

La incapacidad organizativa humana, consecuencia del libre albedrío, del
sentimiento mayoritario de jovialidad y tolerancia de las personas, de la
histórica incapacidad logística para el ejercicio del poder, contrasta con
las aspiraciones calvinistas por la sistematización y homogeneización para
facilitar la gestión a todos los niveles de los asuntos que tratan sobre las
personas y su actividad.

La civilización occidental, incontestablemente dominante en política
internacional, contribuye activamente al proceso de globalización, que ayuda a
facilitar la unión y colaboración de la acción humana en todas sus posibles
dimensiones, individual, familiar, gremial, empresarial, política; sin en la
mayoría de los casos ejercer una acción definitiva sobre la defensa o
abandono de las costumbres individuales, locales y regionales en las
dimensiones mencionadas de las relaciones humanas. Esto es la aceptación por
parte de la autoridad política de algo sobre lo que en realidad no puede
elegir.

Individualmente, cuanto más anticipada y asumida esté esta circunstancia
inevitable, con más preparación se afronta un futuro en el que el individuo
es cada vez menos importante en favor de las redes, la colaboración, y los
colectivos.

¿Sois capaces de cruzar datos de población [10] con datos de empleo [11] a
nivel municipal con un 100% de aciertos?

Hay algunos más municipios (y creciendo) que la cifra en la que estás
pensando. Por supuesto esto implica que la elección entre documentos de unos
años u otros (o cuantos de ellos se consideren) afecta a la longitud de la
solución… Sean sesenta mil caracteres cuadrados la medida de, por ejemplo,
un código de quinientas líneas de largo y ciento veinte columnas (caracteres)
de ancho… ¿sois además capaces de encontrar una solución no usando más de
420k caracteres cuadrados (C), o 230k (C++), 180k (Python), 160k (Java), 140k
(Ruby o PHP) o 130k (Javascript)? Excluyendo el acceso a hojas de cálculo, PDF
y textos ISO/UTF de ese cómputo.

Más acertijos como este en http://madivachallenge.appspot.com.

[1]: https://en.wikipedia.org/wiki/United_Nations_General_Assembly
[2]: https://github.com/eggert/tz/blob/master/zone.tab
[3]: https://github.com/eggert/tz/blob/master/europe
[4]: https://en.wikipedia.org/wiki/Tz_database
[5]: https://es.wikipedia.org/wiki/Lentegí
[6]: https://es.wikipedia.org/wiki/Sarratella
[7]: https://es.wikipedia.org/wiki/Les
[8]: https://es.wikipedia.org/wiki/Rubielos_de_Mora
[9]: https://es.wikipedia.org/wiki/Mora_de_Rubielos
[10]: http://www.ine.es/inebmenu/mnu_padron.htm
[11]: https://www.sepe.es/contenidos/que_es_el_sepe/estadisticas/datos_estadisticos/municipios/index.html

 

U.P

Continúa leyendo este artículo

Revolución BigData

June 15th, 2016 | Big Data, Opinión

Data Analytics Concept

Ha habido muchos momentos en la historia de la humanidad en los que la irrupción de avances tecnológicos han provocado cambios radicales en nuestra civilización. A todos los niveles.

En la segunda mitad del siglo XVIII la revolución industrial supuso una optimización sin precedentes en los procesos de producción. Dicha revolución trajo consigo otros muchos cambios en medios de transporte, producción y consumo de energía, etc

Más recientemente otras revoluciones han cambiado la forma en que trabajamos, nos comunicamos y en definitiva, vivimos. Pocos años después de la aparición del primer movil (1973, Motorola) una persona podía hablar desde el centro de Tokio con otra en Central Park, algo que hasta ese momento sólo cabía en la ciencia ficción.

En 1991 empezó a funcionar la World Wide Web, que supuso el inicio de la democratización del acceso a Internet a nivel mundial. Desde entonces Internet ha permitido que el intercambio de datos y conocimiento a gran escala entre personas, empresas e instituciones sea un proceso instantáneo. Pronto cualquier “cosa” podrá conectarse a Internet (IoT)

Este cambio de paradigma ha sido el catalizador que ha permitido incrementar exponencialmente la velocidad a la que se producen avances en todas las disciplinas: ciencia, tecnología, negocios, etc. Básicamente ha hecho que la humanidad se convierta en una “mente colmena”: un descubrimiento o noticia es compartido en cualquier lugar del planeta y es inmediatamente consumido por otras personas o procesos.

Como suele ser habitual, las sinergias entre distintas tecnologías dan paso a otras nuevas. Esto es lo que sucedió en 2007 con la presentación del primer iPhone: hoy día nadie concibe vivir sin móvil y sin Internet. Su uso ha sido tan ampliamente aceptado que ha supuesto una espectacular catarsis en sectores en los que hacía siglos que no se introducían cambios: Prensa escrita, Discográficas, Viajes…

Hace dos décadas no quedaba rastro de quién/donde/cuando leía un articulo de un periódico de papel. No había manera de saber que canción escuchaba una persona en su Walkman. No sabíamos como estaban compuestos los círculos sociales de las personas, o al menos no podíamos hacerlo a gran escala.

Analyst Working on Laptop

Hemos llegado por tanto a un punto en el que prácticamente toda la actividad humana genera información. Cada segundo se generan cantidades ingentes de datos que hasta hace poco tiempo era inconcebible manejar. Hoy día, gracias al incremento de la potencia de cálculo de los procesadores, al Cloud Computing y sobre todo a nuevas técnicas de análisis de datos, el análisis de esta información no sólo es posible sino que es inevitable.

Estamos asistiendo a una nueva revolución, que la historia bautizará convenientemente pero que de momento conocemos como BigData.

La aparición del BigData y su conjunción con técnicas de Machine Learning permite ya conocer, explotar y predecir los patrones de comportamiento y de consumo de millones de personas: que consumimos, cuando, donde, con quien.

El conjunto de cambios que estas tecnologías están empezando a introducir en nuestras vidas es ya muy significativo:

– Sistemas de recomendación de todo tipo: productos, amigos, contactos, viajes
– Optimización de flotas y rutas de transporte, precios, stock de productos
– Permite a las empresas mejorar el servicio a sus clientes, a los bancos conocer mejor los riesgos crediticios, a los gobiernos gestionar mejor las infraestructuras…

Esta revolución acaba de empezar así que es difícil predecir a que nuevo escenario nos llevará y que nuevas tecnologías y revoluciones nos están esperando en pocos años.

Continúa leyendo este artículo

Continúa leyendo artículos en nuestro blog