Berater für maschinelles Lernen und Computer Vision

Ich bin ein angewandter Forschungswissenschaftler mit über 20 Jahren Erfahrung in den Bereichen Computer Vision, Deep Learning und ML-Systeme. Ich habe in der akademischen Welt und in der Industrie bei Google, Momenta, ENSCO und UMD gearbeitet und wirkungsvolle Lösungen von der Konzeption bis zur Bereitstellung geliefert.

  • 📍 Böblingen, Deutschland
  • 🗣️ Englisch, Katalanisch, Spanisch, Deutsch (A1)
  • 🎓 Ph.D., University of Maryland
Porträt von Xavier Gibert-Serra

Über mich

Ich bin Dr. Xavier Gibert-Serra, ein Berater, der sich auf maschinelles Lernen und Computer Vision spezialisiert hat. Zuvor war ich Staff R&D Engineer bei Momenta Europe und arbeitete an der Wahrnehmung für autonomes Fahren, und Machine Learning Software Engineer bei Google Maps und Google X Robotics. Davor leitete ich bei ENSCO die R&D-Abteilung für Sichtsysteme zur Eisenbahninspektion. Ich habe meinen Ph.D. in Elektrotechnik und Computertechnik an der Universität von Maryland erworben, betreut von Rama Chellappa.

Fähigkeiten

Computer Vision Deep Learning ML-Forschung & -Bereitstellung 3D-Wahrnehmung Sensorfusion Zeitreihenanalyse Python C++ CUDA PyTorch TensorFlow OpenCV ROS MLOps Führung & Mentoring

Erfahrung

  1. Mai 2023 – Jul 2025

    R&D-Ingenieur — Momenta Europe GmbH

    Entwickelte, trainierte und implementierte Wahrnehmungsmodul-Updates für Kunden im Bereich autonomes Fahren in der EU und den USA. Fokus auf 3D-Objekterkennung, Multi-Sensor-Fusion, Tracking, Vorhersage und Data Mining.

  2. Sep 2015 – Apr 2023

    Software-Ingenieur für maschinelles Lernen — Google

    Google Maps: Entwarf große Vision-Pipelines zur Extraktion strukturierter Informationen aus Street View unter Verwendung von Objekterkennung, Segmentierung, OCR und Bündelausgleich.

    X Robotics: Entwickelte Echtzeit-Pose-Schätzungs- und Tracking-Algorithmen für Roboteranwendungen mithilfe geometrischer Techniken.

  3. Sep 2011 – Sep 2015

    Wissenschaftlicher Mitarbeiter — Universität von Maryland

    Leitete ein staatlich gefördertes Projekt zur Erkennung von Eisenbahndefekten. Erstellte GPU-beschleunigte Algorithmen zur Anomalieerkennung, verteilte Verarbeitungspipelines und multimodale medizinische Bildregistrierung.

  4. Apr 2004 – Apr 2013

    Senior Wissenschaftler — ENSCO, Inc.

    ENSCO Rail: Leitete die Bildverarbeitungsgruppe. Entwickelte Echtzeit-Algorithmen für die optische Schienenprofilanalyse und Risserkennung. Verwaltete F&E und die Produktentwicklung der RailScan-Systemfamilie.

    Team ENSCO — DARPA Grand Challenge: Baute einen Hindernisdetektor mit Stereokameras, der es einem Roboterfahrzeug ermöglichte, 91 Meilen autonom durch Wüstengelände zu fahren und den sechsten Platz zu belegen.

  5. Sep 2001 – Dez 2003

    Wissenschaftlicher Mitarbeiter — UMD LAMP Lab

    Entwickelte Frameworks für die Merkmalsextraktion aus Multimedia-Streams, OCR-Auswertung und Klassifizierung unter Verwendung mehrerer Modalitäten.

Ausgewählte Projekte

Projekt Google Maps Street View

Google Maps Street View Extraktion

Erstellte ML-Pipelines zur globalen Extraktion von Straßennamen, Nummern und Verkehrszeichen mittels Erkennung, OCR und semantischer Segmentierung.

Projekt ENSCO JBIS

Erkennung von Rissen in Schienenverbindungen

Implementierte ein Echtzeitsystem zur Risserkennung an fahrenden Zügen mittels Zeilenkameras, das in Inspektionsflotten integriert wurde.

Projekt Momenta AI Autonomes Fahren

Wahrnehmung für autonomes Fahren (Momenta)

Entwickelte Module zur 3D-Objekterkennung, Fusion und Vorhersage für L2+/L3-Systeme für autonomes Fahren in Europa und den USA.

Dexter 2005 DARPA Grand Challenge

DARPA Grand Challenge Hindernisdetektor

Entwarf einen stereo-basierten Hindernisdetektor, der es dem Fahrzeug von Team ENSCO ermöglichte, 91 Meilen autonom zu fahren und den sechsten Platz zu belegen.

Automatische Inspektion von Eisenbahnkomponenten

Automatische Inspektion von Eisenbahnkomponenten

Entwarf ein System zur automatischen Inspektion von Eisenbahnkomponenten mittels Deep Learning, mit Risserkennung, Schwellengradierung und Erkennung von fehlenden und/oder gebrochenen Schienenankern.

CardioViewer: Multimodale Herzanzeige

UMD CardioViewer

Entwicklung eines multimodalen Herzanzeige- und Analysetools für die medizinische Fakultät der University of Maryland.

Ausgewählte Publikationen

  • Adapting Style and Content for Attended Text Sequence Recognition. WACV, 2020. Paper logo  Papier
  • Deep Multitask Learning for Railway Track Inspection. IEEE ITS, 2017. Paper logo  Papier
  • Sequential Score Adaptation with EVT for Railway Inspection. ICCV Workshop, 2015. Paper logo  Papier GitHub logo  Code
  • Material Classification and Semantic Segmentation of Railway Track Images. ICIP, 2015. Paper logo  Papier
  • Discrete Shearlet Transform on GPU for Anomaly Detection. EURASIP JASP, 2014. Paper logo  Papier GitHub logo  Code
  • CardioViewer: A novel modular software tool for integrating cardiac electrophysiology voltage measurements and PET/SPECT data. IEEE NSS/MIC, 2014. Paper logo  Papier

Kontakt

Interessiert an einer Zusammenarbeit? Schreib mir eine E-Mail oder vernetze dich auf LinkedIn.