Visión Computacional

Inicio      Temario      Recursos      Tareas      Prácticas      Proyectos     

Inicio

POSGRADO EN CIENCIA E INGENIERÍA DE LA COMPUTACIÓN

Asignatura: Visión Computacional

Profesores:
Dr. Boris Escalante Ramírez
Dra. Olveres Montiel Jimena

Ayudante:
Rosario Cruz

Horario: Lunes y miércoles 10:00 – 11:30

Temario

TemaTítuloLecturaPráctica
1Introducción1) MTF del ojo humano
1.1¿Qué entendemos por Visión Computacional?Szeliski, capítulo 1
PDF 1.1
1.2Teoría de MarrSzeliski, capítulo 1
1.3Descripción general del curso y Modelo de Visión HumanaPDF 1.3
1.4Formación de imágenes 
(proyecciones, pinhole camera, lentes, aberraciones)
Szeliski, Gonzalez-Woods
PDF 1.4
Continuous Images
1.5Representación digital de la imagenGonzalez-Woods, capítulo 2
PDF 1.5
1.5.1Muestreo y cuantizaciónPDF 1.5.1
1.6Representación de colores
2Sistemas lineales y filtrado2) Filtrado Lineal y Fourier
2.1Sistemas lineales e invariantesGonzalez-Woods, capítulo 2
2.2ConvoluciónGonzalez-Woods, capítulo 3
2.3Transformada de FourierGonzalez-Woods, capítulo 4
PDF 2.3
2.4Filtros espacialesGonzalez-Woods, capítulo 3
PDF 2.4
3Extracción de características
3.1Bordes
3.2Sobel, CannyPDF 3.2
3.3Hough (líneas, círculos)Artículo de Transformada de Hough4) Detección de monedas
Monedas.zip
3.4Esquinas (Harris)PDF 3.4
3.5Espacio-escala
(pirámides, pirámides laplacianas, wavelets)
PDF 3.5
Pyramid methods in image processing
The Laplacian Pyramid as a Compact Image Code
3) Image Blending
3.6SIFT Detector y descriptorPDF 3.6
Artículo de SIFT
4Segmentación
4.1Umbral simple, umbral adaptativo
4.2Crecimiento de región
4.3Divisoria de aguas
4.4Contornos activos (snakes, ASM, levelsets)
4.5Clasificación
4.6Redes Neuronales ConvolucionalesU-NET Original Paper
5Estimación de movimiento

Recursos

Bibliografía

[1] Richard Szeliski. “Computer Vision: Algorithms and Applications”. Springer; 1st Edition (October 1, 2010).  PDF en: http://szeliski.org/Book/
[2] Dr Simon J. D. Prince. “Computer Vision: Models, Learning, and Inference”. Cambridge University Press; 1st Edition (June 18, 2012).
[3] David A. Forsyth, Jean Ponce .”Computer Vision: A Modern Approach”. Pearson; 2nd Edition (November 5, 2011).
[4] Marr, D. “Vision”. W.H. Freeman and Company. 1st Edition (1982).

Tareas

  1. 12/08. Obtener la distancia z a un objeto en el sistema de 2 cámaras visto en clase. Entrega: Jueves 14/08.
  2. 22/08. Implementar un método de dither (puede ser aleatorio, ordenado, o de difusión de error) para imágenes en blanco y negro (si desean lo pueden hacer a color). Entregar impreso un breve reporte que muestre la implementación y los resultados obtenidos. Equipos de máximo 3 personas. Entrega: Jueves 29/08.
  3. 17/09. Implementar un programa para encontrar los coeficientes de filtros binomiales. Entregar impreso el programa y los resultados de 9 coeficientes de la 7a derivada y 9 coeficientes de la 6a derivada. Esta tarea es individual. Entrega: Jueves 19/09.
  4. 01/10. Implementar un programa para hacer Hybrid Images. Entregar impreso un reporte con el programa y los resultados obtenidos. Artículo de referencia: Hybrid Images. Tarea por equipos. Entrega: Martes 08/10.

Prácticas

  1. MTF del ojo humano. Ver la especificación en la tabla del temario. Equipos de máximo 3 personas. Entrega: Martes 03/09.
  2. Filtrado lineal y Fourier. Ver la especificación en la tabla del temario. Entrega: Martes 24/09.
  3. Image Blending. Ver la especificación y artículos de referencia en la tabla del temario. Entrega: Jueves 17/10.
  4. Detección de monedas. Ver la especificación y artículo de referencia en la tabla del temario. Entrega: Martes 12/11. Recordatorio: en la clase del jueves 31/10 ustedes tomarán fotos de sus monedas en el LAPI (ubicado en el Edificio de Posgrado e Investigación 2º piso).

Proyectos