Guia docente
DATOS IDENTIFICATIVOS 2023_24
Asignatura APRENDIZAJE AUTOMÁTICO APLICADO A LA CIBERSEGURIDAD Y EL CIBERCRIMEN Código 01747021
Enseñanza
1747 - Máster Universitario de Investigación en Ciberseguridad
Descriptores Cr.totales Tipo Curso Semestre
3 Optativa Primer Segundo
Idioma
Ingles
Prerrequisitos
Departamento ING.ELECTR.DE SIST. Y AUTOMATI
Responsable
FIDALGO FERNANDEZ , EDUARDO
Correo-e efidf@unileon.es
vgonc@unileon.es
Profesores/as
GONZÁLEZ CASTRO , VICTOR
FIDALGO FERNANDEZ , EDUARDO
Web http://agora.unileon.es/
Descripción general En este curso se abordan aplicaciones del aprendizaje automático, la visión por computador y el procesamiento del lenguaje natural en la lucha contra el cibercrimen. Durante el curso, se explicaran los principales métodos y conceptos relacionados con diversos clasificadores y descriptores de texto o imágenes y cómo se pueden aplicar a la lucha contra el cibercrimen (por ejemplo, reconociendo personas, clasificando el texto de un correo electrónico como spam, o detectando cuándo el tráfico de una red proviene de redes botnet). Estas aplicaciones se implementarán en el laboratorio utilizando Python.
Tribunales de Revisión
Tribunal titular
Cargo Departamento Profesor
Presidente ING.ELECTR.DE SIST. Y AUTOMATI BLAZQUEZ QUINTANA , LUIS FELIPE
Secretario ING.ELECTR.DE SIST. Y AUTOMATI ALAIZ MORETON , HECTOR
Vocal ING.ELECTR.DE SIST. Y AUTOMATI FUERTES MARTINEZ , JUAN JOSE
Tribunal suplente
Cargo Departamento Profesor
Presidente ING.ELECTR.DE SIST. Y AUTOMATI PRADA MEDRANO , MIGUEL ANGEL
Secretario ING.ELECTR.DE SIST. Y AUTOMATI FOCES MORAN , JOSE MARIA
Vocal ING.ELECTR.DE SIST. Y AUTOMATI GARCIA RODRIGUEZ , ISAIAS

Competencias
Tipo A Código Competencias Específicas
  A18801 1747CE17 Conocer el método científico. Capacidad de búsqueda de información y referencias relevantes y redacción de artículos científicos. Organizar y preparar aportaciones para congresos científicos. Knowing the scientific method. Aptitude for gathering of information and relevant references and writing of scientific papers. Organization and presentation of contributions to scientific conferences.
  A18804 1747CE2 Diseñar y desarrollar software seguro en diversos lenguajes de programación evitando generar las vulnerabilidades software más comunes./ Designing and developing secure software in various programming languages avoiding the generation of the most common software vulnerabilities.
  A18812 1747CE9 Prevenir fraudes en comercio electrónico./ Avoiding frauds in electronic commerce.
Tipo B Código Competencias Generales y Transversales
  B5729 1747CG1 Elaborar y defender argumentos y resolver problemas dentro del área de seguridad informática y de las comunicaciones./ Developing and defending arguments and resolving problems in the field of computer and communications security.
  B5730 1747CG2 Reunir e interpretar datos relevantes dentro del área de seguridad informática y de las comunicaciones/Collecting and understanding relevant data in the field of computer and communications security.
  B5731 1747CG3 Emitir juicios sobre temas relevantes de índole social, científica o ética desde la perspectiva de la ciberseguridad./ Judging relevant subjects of social, scientific, or ethical nature from a cybersecurity perspective.
  B5732 1747CG4 Transmitir soluciones al entorno industrial y empresarial en el campo de la ciberseguridad./ Convey solutions to the industrial and corporate environment in the field of cybersecurity.
  B5740 1747CT7 Aprender de forma autónoma./Self-learning ability.
Tipo C Código Competencias Básicas

Resultados de aprendizaje
Resultados Competencias
Programación y análisis tareas en diversos lenguajes de programación en el área de seguridad informática y de las comunicaciones. A18804
A18812
B5729
B5732
B5740
Aplicación de las propiedades biométricas el área de seguridad informática y de las comunicaciones. A18812
B5729
B5730
B5731
B5732
Conocimiento de los conceptos básicos de ingeniería social. A18812
B5731
Conocimiento de el método científico. Capacidad de búsqueda de información y referencias relevantes y redacción de artículos científicos. Preparación de aportaciones para congresos científicos. A18801
Prevención de fraudes en comercio electrónico. A18812
B5731

Contenidos
Bloque Tema
Bloque I: CLASIFICACIÓN DE IMÁGENES Tema 1. CLASIFICACIÓN DE IMÁGENES PARA LA LUCHA CONTRA EL CIBERCRIMEN.
Conceptos, Preprocesamiento, Descriptores de Imagen, Deep Learning para la clasificación de imágenes. Aplicaciones de la clasificación de imágenes para la lucha contra el cibercrimen.

Tema 2. RECONOCIMIENTO DE PERSONAS PARA LA LUCHA CONTRA EL CIBERCRIMEN.
Detección y reconocimiento de rostros. Detección de personas. Hash perceptual
Bloque II. CLASIFICACIÓN DE TEXTO Tema 3. CLASIFICACiÓN DE TEXTO PARA LA LUCHA CONTRA EL CIBERCRIMEN.
Descriptores de texto. Word Embeddings. Modelos de Deep Learning para procesamiento de lenguaje natural. Aplicaciones

Tema 4. DETECCIÓN Y CLASIFICACIÓN DE SPAM.
Aplicación de modelos de clasificación de texto a la detección de Spam


Tema 5. DETECCIÓN AUTOMÁTICA DE PHISHING
Aplicación de modelos de clasificación de texto a la detección de Phishing.
Bloque III. OTRAS APLICACIONES Tema 6. DETECCIÓN DE REDES BOTNET
Conceptos Básicos del modelo TPC/IP. Descripción de tráfico de red. Aplicación de modelos de clasificación para la detección de redes botnet.

Planificación
Metodologías  ::  Pruebas
  Horas en clase Horas fuera de clase Horas totales
Practicas a través de TIC en aulas informáticas 18 19 37
 
Resolución de problemas/ejercicios en el aula ordinaria 2 0 2
Estudio de caso 0 6 6
Presentaciones/exposiciones 4 16 20
 
Sesión Magistral 8 0 8
 
Pruebas mixtas 2 0 2
 
(*)Los datos que aparecen en la tabla de planificación són de carácter orientativo, considerando la heterogeneidad de los alumnos

Metodologías
Metodologías   ::  
  descripción
Practicas a través de TIC en aulas informáticas Las prácticas se realizarán siguiendo los guiones dejados en Ágora. Contienen sesiones prácticas guiadas basadas en programación, utilizadas para evaluar y aprender más a fondo los métodos y técnicas discutidos durante la teoría. Las dudas serán resueltas por el profesor en el aula, por correo electrónico, en reuniones presenciales programadas o mediante sesiones remotas. La solución se entregará a los alumnos a través de una tarea habilitada para ello en Agora.
Resolución de problemas/ejercicios en el aula ordinaria Durante algunas sesiones de teoría, se realizarían ejercicios si es necesario para consolidar ciertos conceptos básicos de Aprendizaje Automático, Visión Artificial y Procesamiento del Lenguaje Natural.
Estudio de caso El alumno seleccionará una de las temáticas de las sesiones de laboratorio. Luego, el alumno resolverá el problema seleccionado utilizando otras estrategias (codificación/clasificador) con ciertas limitaciones indicadas por el profesor. El estudiante estudiará la nueva estrategia a través del trabajo de investigación propuesto.
Presentaciones/exposiciones Los alumnos realizará una presentación para todos los alumnos y el profesor, conteniendo la nueva solución elegida para el problema resuelto.
Sesión Magistral Sesiones teóricas en el aula mediante diapositivas que quedarán grabadas en vídeos. Las presentaciones o documentos correspondientes a los materiales de cada lección se dejarán en Ágora. Algunas lecciones podrían ir acompañadas de videos relacionados con los conceptos presentados, algunos podrían ser grabados por los docentes y otros provenientes de recursos de internet que los docentes consideren apropiados. Los cursos de la plataforma DataCamp, o similares, podrían utilizarse para reforzar algunas de las lecciones impartidas, siendo algunos cursos opcionales y otros obligatorios.

Tutorías
 
Presentaciones/exposiciones
Resolución de problemas/ejercicios en el aula ordinaria
Estudio de caso
Practicas a través de TIC en aulas informáticas
Sesión Magistral
descripción
Los alumnos pueden solicitar atención personalizada a través de correo electrónico en cualquier momento del curso. Dicha atención se brindará vía videoconferencia para alumnos de la modalidad online.

Evaluación
  descripción calificación
Presentaciones/exposiciones Se evaluarán varias partes del proyecto de la asignatura que se presentará a los alumnos, incluida la presentación final que se realizará al profesor. 10
Practicas a través de TIC en aulas informáticas Cada laboratorio contendrá entregables que serán evaluados, y se establecerá una calificación para cada sesión de laboratorio. 50
Sesión Magistral Se realizará un pequeño cuestionario para evaluar los conceptos impartidos en la teoría. 15
Pruebas mixtas Tras el cuestionario, los alumnos realizarán la segunda parte de la evaluación, que consistirá en reproducir una sesión de laboratorio utilizando la plantilla proporcionada pero cambiando algunas partes (codificación, clasificador, preprocesado, datos...) 25
Otros Se podrán plantear actividades voluntarias al alumnado, que se evaluarán para sumar puntos adicionales a los obtenidos en las anteriores pruebas de evaluación
 
Otros comentarios y segunda convocatoria
  • Delayed deliveries will get a pensalisation in the grade.
  • To pass the course in continuous assessment (i.e. the first call) it will be necessary to get at least 5 out of 10 points.
  • Students can compensate grades between parts, as long as the minimum grade on a part is 3 out of 10.
  • Students who do not pass the course in continuous assessment (i.e. the first call) will be able to submit labs which were not submitted or which were not passed during the first call.
  • To pass the course in second call, it will be applied the same instructions than in the first call. 

For students of the ONLINE modality of the master's degree:

In reference to the supervision programs used (SMOWL) during the exams of the official calls of the distance modality, browsing in pages external to that of the exam itself, unless expressly indicated, may result in failure in said activity, at the discretion of the faculty.

In the event that problems arise in student identification, teachers may require additional assessment activities via videoconference. The conditions of these tests may be conditioned by connectivity, lighting, etc. It is the responsibility of the student to follow the instructions received in this regard, as well as to protect their privacy, performing the exam in an appropriate environment (isolated, with good connection, lighting ). , ....). Recommendations for students in the use of SMOWL can be found at the following link: http://bit.ly/3ZrtxVs


Fuentes de información
Acceso a la Lista de lecturas de la asignatura

Básica
  • Cunha. (2022). Deep learning with Python (2a ed) - François Chollet - Manning, outubro 2021, 504 pp. Interações: Sociedade e as novas modernidades, 42, 113-115. https://doi.org/10.31211/interacoes.n42.2022.r1
  • Geron. (2017). Hands-on machine learning with Scikit-Learn and TensorFlow: concepts, tools, and techniques to build intelligent systems  (1st ed.). O’Reilly.
  • Bird. (2009). Natural language processing with Python (Klein & E. Loper, Eds.; 1st edition). O’Reilly.
Complementaria
  • Artículos de investigación cuyas referencias se compartirán con los alumnos y serán actualizadas en la teoría en cada curso académico. 
  • Lewis Tunstall. (s. f.). Natural Language Processing with Transformers. https://www.oreilly.com/library/view/natural-language-processing/9781098136789/
  • Howard. (2020). Deep learning for Coders with fastai and PyTorch?: AI applications without a PhD  (Gugger, Ed.). O’Reilly Media Inc.
  • Huang, Hussain, A., Wang, Q.-F., & Zhang, R. (2019). Deep Learning for Natural Language Processing. En Deep Learning: Fundamentals, Theory and Applications (Vol. 2, pp. 111-138). Springer International Publishing AG. https://doi.org/10.1007/978-3-030-06073-2_5
  • Goodfellow. (2016). Deep learning  (Bengio & A. Courville, Eds.). The MIT Press.

Recomendaciones


Asignaturas que se recomienda haber cursado previamente
FUNDAMENTOS DE MACHINE LEARNING Y APLICACIONES A LA CIBERSEGURIDAD / 01747013
FUNDAMENTOS DE APRENDIZAJE PROFUNDO / 01747015
 
Otros comentarios
Lenguaje de programación Python