Né en 1953 à Monterrey, au Mexique, Héctor García-Molina est considéré comme l’un des plus grands chercheurs au monde dans le domaine des bases de données. Professeur émérite, il a impulsé un courant de pensée extrêmement important et qui perdure toujours aujourd’hui. Présentation de la figure la plus structurante pour les moteurs de recherche modernes.
Après avoir effectué son premier cycle scolaire en génie électrique à l’Instituto Tecnológico y Estudios Superiores (Institut de technologie et d’enseignement supérieur) de Monterrey, Héctor García-Molina rejoint l’Université de Stanford en 1975. Il y obtient une maîtrise en génie électrique puis un doctorat en informatique en 1979. Gio Wiederhold, son directeur pendant son parcours d’études supérieures, l’a initié aux systèmes de bases de données distribuées.
Suite à ça, en 1979, Héctor García-Molina rejoint le corps professoral du département génie électrique de l’Université de Princeton, dans le New Jersey, et y restera 13 ans. Il participe au développement de la technologie qu’on connait tous aujourd’hui sous le nom de RAID : Redundant Array of Independent Disks (regroupement redondant de disques indépendants).
Le RAID est une technique de stockage permettant de répartir des données sur plusieurs disques durs dans le but d’améliorer les performances, la sécurité et d’éviter les pannes. Ce système de redondance d’informations entre plusieurs unités permet de se protéger contre les défaillances. Par exemple quand un disque dur rend l’âme, il permet de ne pas perdre toutes les données.
En 1992, il retourne à l’Université de Stanford mais cette fois-ci en tant que professeur. Il rejoint le département d’informatique et de génie électrique. Il commence à travailler sur l’intégration de l’information permettant de combiner plusieurs bases de données de manière utile et cohérente. Il introduit différentes approches de représentation de l’information, dont l’idée de données semi-structurées. En 1994, il commence à travailler sur les bibliothèques numériques. Héctor García-Molina et Terry Winograd lance le Digital Libraries Project, qui vise à développer des moyens pour collecter, filtrer et stocker les différents types d’informations contenus dans les bibliothèques. Des idées issues de ce projet majeur naît… Google. En effet, parmi la liste des étudiants faisant partie du projet figure un nom : Larry Page, co-fondateur du moteur de recherche.
Héctor García-Molina doit également sa notoriété à son rôle de professeur universitaire, à ce jour toujours reconnu. Au cours de ses 40 années de carrière, il a encadré 57 doctorants dont beaucoup ont des postes importants dans les domaine de la technologie et de l’éducation. Entre autres : Taher Haveliwala et Glen Jeh, qui ont joué un rôle important chez Google avec les algorithmes de la personnalisation des résultats de la SERP ou du Pagerank thématique, et Zoltan Gyöngyi, responsable anti-spam au niveau international chez Google. De plus, bien avant l’apparition des réseaux sociaux, le professeur a encouragé l’un de ses étudiants à développer un réseau social, Club Nexus. Devenu par la suite le réseau social Orkut de Google, il comptait 300 millions d’utilisateurs.
Héctor García-Molina encourageait ses élèves, quelque soit le domaine de leurs recherches. Petite anecdote : à son arrivée à Stanford, il a commencé à offrir un déjeuner à tous les étudiants afin qu’ils partagent leurs expériences personnelles et professionnelles. Les étudiants échangeaient sur leurs recherches, ou parfois, répétaient leurs présentations de conférence. La façon de pensée d’Héctor García-Molina et sa qualité de mentor ont permis à ses étudiants d’être pionniers dans la recherche de nombreux domaines des systèmes de bases de données et la gestion de la donnée.
Le chercheur a également dirigé les équipes dans le développement du système appelé CourseRank. Il s’agit d’une ressource d’informations destinée aux étudiants qui planifient leur programme académique. Le système a été institutionnalisé à Stanford puis reproduit ailleurs. En 2009, CourseRank a été sélectionné pour le SIGMOD Best Demo Award.
Après avoir résolu de nombreux problèmes liés aux systèmes de bases de données, Héctor García-Molina apporte sa contribution à son département dans l’adoption de systèmes plus modernes de traînâtes de grands volumes de données. Il fonde et dirige le Stanford Data Science Institute, projet mêlant entre autres informatique et médecine.
En reconnaissance de ses contributions jugées comme structurantes, Héctor García-Molina est élu membre de l’Association For Computing Machinery (ACM) et de l’American Academy of Arts and Sciences. En 1999, il reçoit le prix ACM SIGMOD Innovation Award pour “contributions innovantes et très importante d’une valeur durable au développement, à la compréhension ou à l’utilisation des systèmes de bases de données”.
Chercheur, professeur mais aussi… Photographe ! Héctor García-Molina était photographe amateur reconnu pour son niveau quasi professionnel. Il a couvert de nombreux évènements sportifs de l’Université de Stanford et a également enseigné cet art.
Héctor García-Molina est décédé le 25 novembre 2019 à l’âge de 65 ans. Il a édité, écrit ou co-écrit neuf livres et publié plus de 400 articles scientifiques. Au delà de tous les algorithmes qu’il a créé, il laisse en héritage un mouvement de pensées innovant et extrêmement structurant, qui a guidé de nombreux grands noms de la Silicon Valley.
Un peu de lecture !
Database System – The complete book, Héctor García-Molina, Jeffrey D.Ullman, Jennifer Widom, Edition Hardback, 2008.
Copy Detection Mechanisms for Digital Documents, Sergey Brin, James Davis, Héctor García-Molina, Department of Computer Science, Stanford University, 199
Sources :
Hector Garcia-Molina, influential computer scientist and database expert, dies at 65, Stanford News, 6 Décembre 2019, https://news.stanford.edu/2019/12/06/hector-garcia-molina-influential-computer-scientist-database-expert-dies-65/
Dr.Hector Garcia-Molina, National Academy of Engineering, https://www.nae.edu/30734/Dr-Hector-GarciaMolina
Hector Garcia-Molina, IEEEXplore, https://ieeexplore.ieee.org/author/38275167200
Influential computer science professor, alum Hector Garcia-Molina dies at 65, Alejandro Salinas, The Stanford Daily, 11 Décembre 2019, https://stanforddaily.com/2019/12/11/influential-computer-science-professor-alum-hector-garcia-molina-dies-at-65/
Hector Garcia-Molina, Google Scholar, https://scholar.google.com/citations?user=bAa___kAAAAJ&hl=fr
RAID (redundant array of independent disks), Alexander S.Gillis, SearchStorage , https://scholar.google.com/citations?user=bAa___kAAAAJ&hl=fr