Machine Learning España #190911


machine-learning-espana-190911

Machine Learning España es el resumen principal de noticias de Machine Learning (Aprendizaje Automático) y Deep Learning (Aprendizaje Profundo) de España.

Los principales desarrollos a nivel mundial en este campo, ya sean nuevas tecnologías, compañías o productos, procesados y simplificados para que lo puedas tener de forma fácil, simple y gratis!

Los ejemplos y tutoriales de Machine Learning permiten que los nuevos contenidos, muchas veces de gran complejidad, sean accesibles para una audiencia más amplia. A su vez, las técnicas y algoritmos de Machine Learning, ofrecen los últimos avances en investigación de forma más interesante y simple de comprender. Se incluye, también, ejemplos y técnicas de Python, ya que es uno de los lenguajes más utilizados en este campo.

Este contenido se complementa con información específica para España.


Medidas de proximidad en minería de datos y Machine Learning


El término proximidad entre dos objetos es una función de la proximidad entre los atributos correspondientes de los dos objetos. Las medidas de proximidad se refieren a las medidas de Similitud y Disimilitud. La similitud y la disimilitud son importantes porque son utilizadas por una serie de técnicas de minería de datos, como la agrupación, la clasificación del vecino más cercano (KNN) y la detección de anomalías.

Comenzaremos la discusión con definiciones de alto nivel y exploraremos cómo están relacionadas. Luego, avanzamos para hablar de proximidad en dos objetos de datos con un atributo simple y pasar a objetos con múltiples atributos.

¿Qué es la similitud?
- Es una medida numérica del grado en que los dos objetos son iguales.
- Mayor para un par de objetos que son más parecidos.
- Generalmente no negativo y entre 0 y 1.

¿Qué es la disimilitud?
- Es una medida numérica del grado en que los dos objetos son diferentes.
- Baja para un par de objetos que son más similares.
- Rango 0 al infinito.

Función de transformación
Es una función utilizada para convertir similitudes en diferencias y viceversa, o para transformar una medida de proximidad en un rango particular.

http://bit.ly/2ZLaKdd

 

Cuando la experiencia humana mejora el trabajo de las máquinas


Los algoritmos de Machine Learning a veces pueden hacer un mejor trabajo con un poco de ayuda de la experiencia humana, al menos en el campo de la ciencia de materiales.

En muchas áreas especializadas de ciencia, ingeniería y medicina, los investigadores están recurriendo a algoritmos de Machine Learning para analizar conjuntos de datos que han crecido demasiado para que los humanos los entiendan. En la ciencia de los materiales, el éxito con este esfuerzo podría acelerar el diseño de materiales funcionales avanzados de próxima generación, donde el desarrollo ahora depende del antiguo ensayo y error.

Sin embargo, por sí mismas, las técnicas de análisis de datos tomadas de otras áreas de investigación a menudo no brindan los conocimientos necesarios para ayudar a los científicos e ingenieros de materiales a elegir cuál de las muchas variables ajustar, y no pueden explicar cambios dramáticos como la introducción de un nuevo compuesto químico en el proceso. En algunos materiales complejos como los ferroeléctricos, hasta 10 factores diferentes pueden afectar las propiedades del producto resultante.

En un artículo publicado en la revista NPJ Computational Materials, los investigadores explican cómo dar a las máquinas una ventaja para resolver el desafío mediante la organización inteligente de los datos que se analizarán en función del conocimiento humano de los factores que probablemente sean importantes y relacionados. Conocida como apilamiento dimensional, la técnica muestra que la experiencia humana todavía tiene un papel que desempeñar en la era de la Inteligencia Artificial.

http://bit.ly/2ZM3JIl

 

Mejores simulaciones revolucionarán Machine Learning


No hay duda de que Machine Learning a menudo se siente mágico. Como ingeniero de Machine Learning, todavía estoy fascinado cuando mi modelo resuelve un problema muy difícil de alta dimensión que, de lo contrario, no hubiera podido resolverse. Estoy convencido de que las soluciones basadas en datos resolverán los problemas más desafiantes en el futuro, como la conducción autónoma y que el Software 2.0 desempeñará un papel muy importante.

Sin embargo, el rendimiento de esos algoritmos depende en gran medida de sus datos. Si alguna vez ha entrenado una red neuronal usted mismo, descubrirá rápidamente que está limitado tanto por la calidad como por la cantidad de sus datos.

Podríamos resumirlo así:
- Si tiene suficientes datos de buena calidad -> El rendimiento podría ser bueno.
- Si tiene datos incorrectos -> El rendimiento será malo.

¿De dónde obtengo suficientes datos buenos?
Obtener los datos es el problema más difícil en Machine Learning en mi opinión. Si desea enseñarle a un automóvil a conducir solo, necesitará miles de millas de conducción humana. Si desea detectar cuándo se rompe una ventana, tendrá que romper miles de ventanas usted mismo y grabar sus sonidos (de hecho, conozco una empresa que lo hizo).

Romper miles de ventanas diferentes es costoso y lleva mucho tiempo. Este es el mayor cuello de botella para resolver la mayoría de los problemas con una solución basada en datos como Machine Learning.

La simulación
Pero, ¿qué pasaría si pudieras construir una buena simulación donde pudiéramos romper ventanas y conducir autos? Podríamos generar millones de muestras de entrenamiento en poco tiempo y sin esfuerzo.

http://bit.ly/2ZIwlCs

 
Tu opinión es muy importante! Deja tu comentario con sugerencias o ideas de cómo mejorar este servicio.

Puedes seguir noticias y eventos en facebook: https://www.facebook.com/machinelearningespana

#machinelearning #deeplearning #espana #españa

 

Comentarios

Entradas populares