Information extraction from electronic health records

Sala 6.3.27, Ciências ULisboa

Por Fernando Gallego Donoso (University of Malaga, Computational Intelligence in Biomedicine - ICB).

Following the digitization of health reports into electronic health records (EHR), the need for techniques or algorithms to extract and leverage the information within these records has significantly increased. Natural language processing (NLP), specifically subfields such as named entity recognition (NER) and named entity linking (NEL) to different standards, is one of the main solutions. However, due to the nature of these records, which are often not shared due to privacy concerns, the available samples are scarce or virtually non-existent. In recent years, several shared tasks, mainly carried out by Barcelona Supercomputing Center (BSC), have emerged, providing researchers with new annotated records to improve the state of the art in NER and NEL. With this increase in data, NER has managed to accurately detect entities present in domain-specific texts. Despite this, knowledge bases (KBs) used as annotation standards, such as SNOMED-CT or the Unified Medical Language System (UMLS), are vast, with the latter encompassing over 3.5 million concepts in Spanish. This, combined with the diversity and heterogeneity of language, whether focusing on a single language or adding complexity by considering multiple languages, renders traditional approaches like classification ineffective. This has led me to explore alternative solutions that maximize performance in this series of tasks through the use of contrastive learning, the enrichment of knowledge bases, and their potential combinations with more traditional approaches. In this talk, I will explain the developments in natural language processing, mainly in named entity recognition and subsequent linking, with the latest advancements in the clinical domain. Furthermore, I'll delve into how these innovations are poised to revolutionize the accessibility and utility of health data, paving the way for more personalized and efficient healthcare solutions.

Bio: Fernando is a Ph.D. candidate at University of Malaga, and member of the Computational Intelligence in Biomedicine (ICB). His work focuses on extracting information present in electronic health records and leveraging it to improve decision-making in the medical sector. In this regard, natural language processing techniques such as named entity recognition or linking to different standards are essential.

LASIGE Computer Science and Engineering Research Centre

Seminário Doutoral II (Doutoramento em Biologia - Especialidade de Biologia Molecular), por Zohra Gulzar Lodhia.

Seminário do Departamento de Física de Ciências ULisboa, por Kora Muzic (Instituto de Astrofísica e Ciências do Espaço, FCUL).

Logótipo do evento

Evento final do Projeto iSEA, com inscrições até 30 de abril.

Earth Systems Seminar, por Sandra Plecha (IDL, Centre OIE - Mines Paris).

Seminário do Centro de Estatística e Aplicações da Universidade de Lisboa e do Centro de Matemática Computacional e Estocástica, por Ben Stevenson (University of Auckland, New Zealand).

Logótipo do Dia Aberto e fotografia de atividade de investigação

Bem-vindos a Ciências ULisboa!

Seminário Doutoral (Doutoramento em Informática), por Rodrigo Santos.

Aula aberta no âmbito da Unidade Curricular de Linguagens de Domínio, por Bruno Martinho (OutSystems).

Esta atividade insere-se no projeto INVASIVES, desenvolvido por uma equipa de investigadores de Ciências ULisboa.

Título e data do workshop

Workshop no âmbito da recente adesão da Universidade de Lisboa à CoARA - Coalition for Advancing Research Assessment.

Mathematical Logic Seminar, por Jean-Baptiste Joinet (Université Jean Moulin, Lyon 3, France).

Talk @LASIGE, por Haily Merritt (Department of Informatics, Indiana University, Bloomington, IN, United States).

Talk @DI, por Nuno Paiva (Parlamento Europeu).

Título/data/local/orador do evento

Lisbon AI Seminar, por Francisco Laranjinha (CFCUL/RG2).

Título/data/local do evento e fotografia do orador

Conferência por Jordi Segalàs (professor associado na Universidade Politécnica de Catalunya - UPC Barcelona Tech; coordenador do grupo de investigação sobre Educação para a Sustentabilidade e Tecnologia).

Título do curso

Curso Avançado CEAUL / Gades Solutions.

Título e datas de candidatura do programa, sobre um padrão em tons de roxo e laranja

Submissão de candidaturas até 14 de maio.

O workshop pretende levar à discussão as coleções botânicas, em particular as de botânica económica, mostrando diferentes perspetivas e olhares sobre as coleções e qual o seu papel na ciência e nas artes.

Seminário do Centro de Física Teórica e Computacional, por Julian Oberdisse (Laboratoire Charles Coulomb - L2C, University of Montpellier, CNRS, France).

Logótipo do LIP Summer Internship Program e fotografia de jovem investigador

Os estágios podem ter uma duração entre duas semanas e dois meses e realizam-se nos três polos do LIP - candidaturas até 15 de maio.

Logótipo do EVM 2024

Candidaturas até 15 de maio.

Os oradores plenários irão falar sobre a importância da interdisciplinaridade de forma acessível para todos, estando previstas palestras e apresentação de pósteres por alunos.

Colóquio de Matemática, por Guy Bouchitté (Université de Toulon).

Aula aberta no âmbito da Unidade Curricular de Aprendizagem Profunda, por João Carreira (Deepmind).

Seminário do Laboratório de Instrumentação e Física Experimental de Partículas, por Pedro Assis (LIP).
