Category: Big Data e Inteligencia Artificial

El Small Data  es un conjunto de datos con un volumen y un formato que hacen que los datos sean accesibles, informativos y procesables.

El término Small Data contrasta con el de Big Data y Small Data supone un cambio en la forma en que las compañías hacen uso de sus datos. A diferencia del Big Data que gira en torno a la idea de que la empresas hacen uso de cantidades masivas de datos para identificar el comportamiento del cliente o impulsar su negocio, el Small Data pretende ser un contrapunto a esta tendencia.

El Small Data implica adquirir conjuntos de datos específicos a través de un menor esfuerzo, algo que los expertos consideran una práctica comercial más eficiente. En este punto, podemos decir que una de las principales diferencias entre Small Data y el Big Data. El uso de Small Data es más asequible para las empresas ya que pueden obtener resultados procesables sin tener que adquirir sistemas costosos que requiere un análisis del Big Data.

Para qué utilizar Small Data y qué ventajas ofrece

Una vez que ya hemos descrito qué es Small Data y en qué se diferencia al Big Data, enumeramos algunas ventajas a tener en cuenta si vas a comenzar a utilizar Small Data:

  • El análisis Big Data es más complicado que el Small Data. El Big Data requiere tecnología y perfiles profesionales expertos de Datos que sepan analizar y manejar grandes volúmenes de datos para extraer solo la información relevante para nuestro negocio utilizando algoritmos y modelos matemáticos. Por el contrario, el Small Data es más sencillo. No necesitaremos la ayuda de un data scientist para analizar y manejar los datos.
  • El Small Data está enfocado a conocer al consumidor. Debemos centrarnos en lo que el consumidor necesita y de qué manera podemos interactuar con el. El Small Data facilita que encontremos la información necesaria para implementar campañas más personalizadas y afines a sus gustos y necesidades.
  • Relacionado con esto, podemos decir que el Small Data tiene aplicación en el sector consumo. Sin apenas darse cuenta, el consumidor ya hace uso del Small Data en su día a día. Los dispositivos inteligentes o el IoT optimizan sus compras, potencian su actividad física diaria, gestionan sus finanzas o recomiendan qué puedes ver en TV en base a tus gustos o necesidades. La finalidad de todo esto es que el consumidor obtenga información cada vez más personalizada en función de los datos que previamente ha registrado en el sistema que consuma.
  • El análisis Small Data es sencillo porque está a nuestro alrededor. Este punto va referido a los datos que obtenemos en Redes Sociales. Cada vez que nos registramos en una red social, realizamos una búsqueda o escribimos una publicación, generamos una huella digital propia con información personalizada. Cualquier otro usuario puede analizar estos datos y sacar conclusiones en base a aquello que otros han compartido en Redes Sociales.
  • El Small Data ayuda a interactuar con el cliente en base a datos útiles y concretos. El marketing basado en los datos supone una revolución ya que las empresas pueden interactuar con sus clientes de forma personalizada y basar sus decisiones en datos en lugar de suposiciones.
  • El Small Data aumenta el retorno de la inversión. La inversión en Small Data comparado con el retorno que te ofrece al poder plantear campañas más eficaces en menos tiempo es mínima; por este motivo el Small Data ayuda a mejorar el ROI.
  • El Small Data es la clave para crear perfiles CRM. De toda la información útil extraída de canales sociales sobre tus clientes, servirán para crear segmentos, perfiles y/o definir cuales son influyentes o tienen más probabilidades de ser stakeholders, etc.

Machine Learning está transformando muchas industrias al tiempo que permite nuevos tipos de productos y servicios que nadie ha soñado hasta hace poco. Sin embargo, el conjunto de habilidades requerido para desarrollar aplicaciones de Aprendizaje automático en la vida real ha permanecido en su mayor parte en el terreno de los pocos académicos y científicos privilegiados. El mundo y la fuerza laboral global no pueden permitirse quedarse detrás de la curva en este habilitador clave de la tecnología, por lo que necesitamos con urgencia producir un grupo mucho mayor de profesionales con conocimientos de alfabetización en materia de ML, como desarrolladores, analistas, gerentes y expertos en la materia.

Para contribuir de manera significativa en este asunto, BigML , con la colaboración de la Escuela de Organización Industrial y el Ayuntamiento de Sevilla, preparan el lanzamiento de la primera edición de Machine Learning School en Sevilla. Machine Learning School o #MLSEV tendrá lugar los próximos 7 y 8 de marzo en el Salón de Actos de la Escuela de Negocios EOI, en el Parque Tecnológico de la Isla de la Cartuja (Sevilla).El objetivo del evento es acercar y desarrollar los conocimientos sobre el Machine Learning, para que los asistentes descubran el impacto que este puede llegar a tener en sus empresas y aprendan a aumentar significativamente su productividad.

Este evento es ideal para muchos profesionales que desean resolver problemas del mundo real aplicando el Machine Learning de manera práctica, por ejemplo, analistas, líderes empresariales, profesionales de la industria y cualquier persona que desee hacer más con menos recursos aprovechando el poder. Por este motivo, estará enfocado principalmente a altos mandos e intermedios de empresas así como personal del ámbito académico.

El #MLSEV de dos días de duración se incluirán clases magistrales, casos de usos y talleres prácticos que permitan a sus asistentes a aprender los conocimientos y técnicas básicas del Machine Learning. Además de los conceptos básicos, el curso cubrirá una selección de técnicas de vanguardia con ejemplos relevantes orientados a los negocios, como aplicaciones inteligentes, casos de uso en el mundo real en múltiples industrias, talleres prácticos y mucho más.

El aforo será limitado, con un cupo máximo de 200 personas, por lo que si estas interesado puedes registrarte hoy mismo y realizar tu solicitud para asegurar tu plaza. Podrás seguir las novedades del evento a través de la etiqueta #MLSEV en las redes Twitter, LinkedIn y Facebook.

lecturers MLSEV

La clasificación automática de documentos consiste en utilizar técnicas de Inteligencia Artificial sobre un conjunto de elementos para ordenarlos por clases o categorías. Sin embargo, también se pueden utilizar estas técnicas para asignar un documento a una determinada clase o categoría.

Par llevar a cabo la clasificación automática de documentos primero hay que realizar una extracción de features (características) destinadas a ser informativos y no redundantes. Esto facilitará los pasos posteriores de machine learning en la clasificación automática de documentos. La extracción de características (features) se trata de un proceso de reducción y codificación, donde un conjunto inicial de variables sin procesar (ej. texto en un documento) se reduce a características más manejables para su procesamiento (ej. números) y que se describa con precisión el conjunto de datos original.

Existen diversas técnicas de extracción de features:

Técnica clásicas

  • Term frequency – Inverse document frequency (TF IDF). Se trata una técnica muy utilizada en Machine Learning. para otorgar la relevancia de una palabra en un documento de una colección a través de una medida numérica. Esta medida numérica se utiliza para calificar la relevancia de una palabra dentro de un documento a partir de la frecuencia que aparece en el mismo. La idea en la que se basa esta técnica es que si una palabra aparece frecuentemente en el documento, debe ser importante y se le debe dar una puntuación alta. Sin embargo, si una palabra aparece frecuentemente en otros documentos, probablemente no sea un identificador único, y por tanto, se le debe asignar una puntuación más baja. Aquí, puedes consultar la fórmula matemática.

Nuevas técnicas basadas en Deep Learning:

  • Doc2vec. El objetivo principal de Doc2Vec es asociar documentos arbitrarios con etiquetas. Doc2vec es una extensión de word2vec que aprende a correlacionar etiquetas y palabras, en lugar de palabras con otras palabras. El primer paso es crear un vector que represente el “significado” de un documento para que luego se pueda utilizar como entrada a un algoritmo de aprendizaje automático supervisado y así asociar documentos con etiquetas.

Tras la extracción de features y en base a la información previa que se posea de los documentos a clasificar o categorizar, se podrán realizar diversas técnicas para la clasificación automática de documentos:

  • Clasificación supervisada. Cuando tenemos conocimiento del conjunto de documentos previamente clasificados de forma manual, ésto nos servirán para entrenar al sistema inteligente en la clasificación automática.
  • Clasificación no supervisada o clustering de documentos. Cuando no tenemos información a priori del conjunto de documentos ni de las categorías en las que deben estar clasificados.

Cuáles son las técnicas de clasificación automática de documentos más usadas

Según el tipo de clasificación, existen:

  • Técnicas de aprendizaje supervisado para clasificaciones supervisadas. Estas técnicas intentan reducir una función que partiendo de la colección de documentos (clasificación manual), tomando un documento de entrada sea capaz de predecir la clase o categoría a la que corresponde ese documento. En otras palabras, estas técnicas de clasificación supervisadas parten de un conjunto de documentos ya clasificados de forma manual (conjunto de entrenamiento) y se intenta asignar una clasificación a un segundo conjunto de documentos. Dependiendo del tipo de colección de documento o tipo de documentos a clasificar, se utilizarán unas técnicas u otras, desde algoritmos de clasificación bayesianos, arboles de decisiones, redes neuronales, …
  • Algoritmos de clustering para clasificaciones no supervisadas. Cuando no se disponen de un conjunto de documentos previamente clasificados, se opta por, a partir de las propiedades de los documentos, agruparlos (clustering) según sus semejanzas entre sí.

 

Hace décadas, ya había empresas que recogían y analizaban datos para poder obtener perspectivas y descubrir tendencias de los consumidores. Para ello, plasmaban los números en hojas de cálculo y los examinaban manualmente. Hoy en día, el análisis de datos se realiza mediante sistemas de software sofisticados. Esto permite estudiar una mayor cantidad de datos, reduciendo el tiempo que se invierte en ello y, por tanto, posibilitando a las empresas a tomar decisiones de manera más rápida y eficaz, lo que ayuda al negocio a seguir siendo competitivo en el mercado.

A pesar de esto, muchos son los que siguen asociando aún el Big Data a las empresas de nuevas tecnologías, creyendo que sus aplicaciones no pueden salir de ese mercado.

Ejemplos de implementación de Big Data en grandes marcas

Actualmente, debido a la cantidades dispositivos que nos rodean, estamos constantemente en contacto con grandes cantidades de datos. Este hecho, ha provocado que los grandes casos de éxito de la aplicación del Big Data vengan de la mano de compañías que no tienen nada que ver con el mercado de las nuevas tecnologías. El Big Data y la Inteligencia Artificial son dos conceptos que suelen ir ligados, a continuación os exponemos 4 ejemplos de grandes marcas que los han implementado en sus estrategias de marketing:

  1. Netflix

Esta plataforma utiliza los datos en su gran mayoría para recomendar contenido a sus consumidores, pero también para poder averiguar qué series producir y a qué figuras del mundillo debe fichar. La serie original de Netflix “House of Cards”, ha sido la primera en alcanzar el éxito gracias al análisis previo de grandes conjuntos de datos. A la plataforma, le llevó alrededor de seis años recopilar todos los datos que creían necesarios para realizar una serie que tuviese una gran acogida entre el público. Emplearon dichos datos a cerca de los hábitos de los espectadores para diseñar un contenido que combinara creatividad y Big Data. Esto, ha conseguido demostrar la gran importancia del estudio de los hábitos de los consumidores a la hora de generar productos, contenidos y servicios.

  1. Nike

Uno de los mayores ejemplos de implementación del Big Data a nivel deportivo. Nike, mediante su plataforma Nike+, captura día a día una elevada cantidad de datos que hacen referencia a distintas características de su usuarios. Esto, le permite poder determinar aspectos como el potencial que posee para la marca ese cliente, cuando tendrá este la necesidad de adquirir nuevo producto en función de la actividad física que realiza o cuáles son sus intereses en ámbitos relacionados con el deporte, dándole la posibilidad de mostrarle a los usuarios una oferta de productos y servicios personalizada.

Para recoger los datos, ha desarrollado una serie de dispositivos wearables, los cuales vende a los usuarios como productos complementarios que mejoran su rendimiento físico. Esta tecnología, está interactuando de forma continua con el usuario y las aplicaciones pertinentes, lo que facilita la recopilación de datos y produce una aceleración de todo el proceso.

  1. Zara

Ya en la década de 1980, fue pionera en un concepto de moda conocido como fast-fashion: desarrolló un método de rápida reacción a las cambiantes tendencias de moda, empleando cadenas de suministros basadas en el abastecimiento cerca de la sede para poder acelerar los plazos de entrega.

Pero los nuevos competidores crecen, y esto ha hecho que Zara de un paso más en el empleo de datos en sus estrategias. Ha conseguido desarrollar una tecnología de identificación por radiofrecuencia (RFID). Esta tecnología, recoge los datos de posición de todas las prendas que se encuentran en las tiendas y los almacenes, como si cada una de ellas llevara un pequeño GPS incrustado. Permite identificar las prendas de individualmente durante su recorrido desde las plataformas logísticas hasta su venta, de manera que, cuando un cliente busca una prenda concreta, el personal de la tienda puede saber en tiempo real la disponibilidad del producto en esa tienda u otra cercana. Esto hace posible que, gracias al seguimiento del Big Data, los artículos sean localizados más rápido y con mayor precisión, lo que favorecerá al servicio y a la fidelización de los compradores.

  1. Coca-cola

Emplea el Big Data para establecer precios y mantener cierta consistencia en el sabor de productos ligados a cuestiones naturales, partiendo de datos del tiempo, información de cosechas e históricos de precios. Además, han lanzado una nueva bebida teniendo como base los datos extraídos de los sistemas self-service, los cuales proporcionan información sobre los gustos de los consumidores. Pero esto no es para lo único que utilizan la gran cantidad de datos que recogen sobre los usuarios, llevan años empleándolos para medir la presencia de sus productos y los de sus competidores en las fotografías que son subidas a la red. Una vez que han analizado esta conducta y mediante algoritmos, deciden qué anuncios deben servir a esos internautas. Con esto consiguen que su publicidad posea hasta 4 veces más posibilidades de que hagan clic en ella.