'Modern deep learning and advanced computer vision' es una revisión amplia y de cierta profundidad de dos campos muy relacionados: por un lado el área de machine learning y en especial deep learning y, por otro, la visión artificial propiamente dicha. Y digo esto porque puede partecer un libro sobre visión artificial, y con esa idea realmente lo compré y leí, y que lo relativo al machine learning es un mero apoyo. Sin embargo, no es así del todo: lo cierto es que hay bastante tratamiento de machine learning y deep learning 'per se', con independencia de sus participación en el campo de la visión artificial.
Se trata de un libro más bien extenso y de complejidad media-alta, aunque en este punto es algo variable, con secciones bastante complejas y otras, sin embargo, casi divulgativas.
El libro se estructura en solo cinco capítulos aunque, eso sí, de bastante longitud cada uno:
- 'Fundamentals of computer visión': Comienza con algunas ideas básicas como qué es la visión artificial y sus etapas en la formación de imágenes y en visión en niveles 1, 2 y 3. Luego revisa ideas de algoritmos mediante cinco casos de estudio para, a continuación, acometer una revisión de aplicaciones desde un punto de vista sectorial y, en concreto, comentando los sectores de distribución, automoción, salud, banca e industria. Y finaliza el capítulo revisando algunos campos relacionados con la visión artificial como son la inteligencia artificial, el machine learning, el procesamiento de lenguaje natural, el procesado de señal y la visión en robots.
- 'Machine learning and computer vision': Un capítulo que, aunque en teoría relacionado con visión artificial, en realidad es prácticamente un repaso de la disciplina del machine learning. Comienza con conceptos de base empezando por explicar lo que es el propio machine learning, algunos de sus retos y dificultades, dónde se encuentran habitualmente aplicaciones de machine learning en nuestro día a día y su conexión con ideas como la inteligencia artificial, las redes neuronales o el aprendizaje estadístico. A continuación explica las tres tipos típicos de aprendizaje: supervisado, no supervisado y por refuerzo, para, finalmente, hacer un extenso recorrido por los principales algoritmos del machine learning con hasta quince familias de algoritmos que incluyen las regresión lineal y logística, árboles de decisión, análisis de componentes principales, support vector machines, etc.
- 'Modern deep learning approaches': Manteniéndose todavía en conceptos casi independientes de la visión artificial, en este capítulo profundiza en el deep learning, explicando en qué consiste y su relación con la visión artificial abordando una amplia revisión de arquitecturas modernas que incluyen, por ejemplo GoogLeNet, AlexNet, ResNet o las redes de convolución basadas en regiones. Luego acomete una descripción de hasta diez algoritmos de deep learning muy recientes como las máquinas de Boltzman, las redes lambertianas o YOLO, en lo que es, probablemente, la parte más especializada y compleja del libro.
- 'Recent trends in computer vision': Es una revisión, bastante más accesible y atractiva, de diferentes tendencias, doce, en visión artificial. Se habla, por ejemplo, de realidad aumentada, de reconstrucción 3D, de contestación viisual a preguntas, de la transferencia de aprendizaje, etc
- 'Advanced computer vision techniques': Un último capítulo dedicado a las técnicas más avanzadas de visión artificial pero explicadas con un tono más divulgativo y entretenido que la parte central del libro y donde se habla, por ejemplo, de la generación de contenido viisual mediante redes adversarias, de analítica de vídeo, de espejos inteligentes, de la mezcla de lenguaje y visión, etc
'Modern deep learning and advanced computer vision' es un libro con mucho conocimiento e información, a ratos algo denso, a ratos entretenido, pero sin duda con una gran aportación de conceptos e ideas.
No está, probablemente, al alcance de cualquier lector, pero para según qué perfiles, puede aportar una gran visión de conjunto y también conocimientos especializados de algunas áreas, especialmente las algorítmicas.
Ficha técnica:
AUTOR: Thomas Binford, P.S.Jagadeesh Kumar, J. Ruby, J. Lepika, J. Tisa y J. Nedumaan.
EDITORIAL: Intel
AÑO: 2019
ISBN: 978-1708798642
PAGINAS: 531
PAGINAS: 531
Artículos de este blog relacionados
- Las cuatro fases del reconocimiento facial
- Cinco definiciones de machine learning
- Principales aportaciones de la visión artificial
- Inteligencia Artificial y las comparaciones odiosas
- Los tres niveles en visión artificial
- Funcionamiento del cerebro e Inteligencia Artificial
No hay comentarios:
Publicar un comentario