DCOD | Cybersécurité • IA • Tech DCOD | Cybersécurité • IA • Tech
Navigation
  • Accueil
  • Cyber-attaques / fraudes
  • Intelligence artificielle
  • Failles / vulnérabilités
  • Pertes / vols de données
  • Cybercrime
  • Législation
Les derniers articles
  • Couverture du rapport ANSSI Panorama de la cybermenace 2025 par DCOD.ch. Visuel symbolisant les risques de sabotage et d'instabilité numérique avec une tour de blocs chutant sur fond de mappemonde en données binaires.
    Cybermenace 2025 : l’ANSSI dresse un bilan sous haute tension
  • Illustration d'une salle de serveurs informatiques avec le logo d'Interpol en blanc sur un filtre violet, symbolisant le démantèlement d'infrastructures cybercriminelles lors de l'opération Synergia III.
    Synergia III : Interpol neutralise 45 000 serveurs malveillants
  • Illustration d'un routeur piraté avec logo de crâne et Wi-Fi pour le dossier SocksEscort.
    SocksEscort : Europol démantèle un réseau de 369 000 routeurs piratés
  • Illustration pour la veille cybercriminalité et crypto : une paire de menottes en métal repose sur un clavier d'ordinateur au premier plan. En arrière-plan sombre, une silhouette de hacker encapuchonné fait face à un réseau lumineux d'icônes de cryptomonnaies interconnectées, incluant les symboles du Bitcoin et de l'Ethereum, dans des teintes bleues et rouges.
    Cybercriminalité : les 10 affaires et sanctions du 20 mars 2026
  • Image d'illustration de l'attaque sur les messageries : un pirate en pull à capuche devant son ordinateur, avec les logos WhatsApp et Signal affichés, incluant le filigrane d'expert dcod.ch.
    Signal et WhatsApp : des acteurs russes ciblent des diplomates
Suivez en direct
DCOD | Cybersécurité • IA • Tech DCOD | Cybersécurité • IA • Tech
Cybersécurité • IA • Tech

Capter l'info, retenir l'essentiel. Pour les pros et passionnés.

DCOD | Cybersécurité • IA • Tech DCOD | Cybersécurité • IA • Tech DCOD | Cybersécurité • IA • Tech DCOD | Cybersécurité • IA • Tech
  • Cyberattaques
  • Vulnérabilités
  • Vols de données
  • Cybercrime
  • IA & Tech
  • Intelligence artificielle
  • Analyses / Rapports cybersécurité

Les LLMs surpassent-ils Google Lens en géolocalisation visuelle ?

  • Marc Barbezat
  • 10 juin 2025
  • 3 minutes de lecture
Vue panoramique d’un paysage verdoyant dans les Alpes suisses, avec un pic montagneux en arrière-plan et une icône de géolocalisation rouge au premier plan — illustration d’un test de géolocalisation assistée par intelligence artificielle.
▾ Sommaire
Des modèles mis au défi sur 25 images uniquesDes scènes sans indice décodées par l’IADes performances en dents de scie selon les modèlesForces et limites des LLMs face à Google LensPour en savoir plus(Re)découvrez également:
Test grandeur nature : des IA comme ChatGPT surpassent Google Lens pour localiser des images sans métadonnées, mais révèlent aussi leurs limites.

Les modèles de langage analysent des images pour les géolocaliser avec une précision croissante. Un test massif révèle des avancées, mais aussi leurs limites.

En 2023, les LLMs étaient encore incapables de localiser correctement des images sans métadonnées. En 2025, les modèles comme ChatGPT o4-mini ou Grok DeeperSearch font preuve d’une compétence impressionnante face à des scènes complexes et non publiées en ligne. Une équipe de chercheurs a mis à l’épreuve 20 modèles IA, issus de cinq grandes entreprises (OpenAI, Google, Anthropic, Mistral et xAI), sur 25 photos inédites prises aux quatre coins du monde.

Des modèles mis au défi sur 25 images uniques

Chaque modèle a reçu les mêmes images d’environnements urbains ou naturels, sans contexte ni données exif, accompagnées de la simple question : « Où cette photo a-t-elle été prise ? ». L’objectif ? Comparer leurs performances à celles de Google Lens. Les scènes variaient entre rues denses, plages isolées et paysages alpins.

L'essentiel Cybersécurité, IA & Tech

Rejoignez la communauté. 3 fois par semaine, recevez l'analyse des tendances par Marc Barbezat. Pas de spam, juste de l'info.

Ou suivez le flux temps réel
Telegram Discord

ChatGPT o3, o4-mini et o4-mini-high se sont distingués en surpassant Google Lens dans plusieurs cas. Par exemple, face à une route enneigée au Japon, ChatGPT a identifié la région de Nagano/Toyama en s’appuyant sur des indices subtils (kanji, barrières de sécurité). À l’inverse, Gemini a fourni une réponse vague, mentionnant plusieurs continents.

Des scènes sans indice décodées par l’IA

Un champ suisse sans repère apparent a permis à ChatGPT o4-mini-high de proposer une localisation entre Zurich et le Jura, contre une erreur manifeste de Grok qui, influencé par le nom de l’utilisateur, a conclu à une photo prise aux Pays-Bas. Cette capacité à extraire des signaux faibles – reliefs, architecture, typographie – constitue l’atout majeur des LLMs.

Autre exemple frappant : une ruelle à Singapour, dont le décryptage de boîtes aux lettres a permis à certains modèles d’atteindre une précision exceptionnelle. ChatGPT a cité l’adresse visible sur une étiquette, tandis que Gemini confondait les écritures pour supposer un lieu en Thaïlande.

Des performances en dents de scie selon les modèles

Le test a aussi souligné les disparités entre versions. Claude Opus 4 ou Sonnet 3.7 d’Anthropic ont pêné à proposer des localisations précises, se limitant parfois à un continent. Grok s’est démarqué par un bon score dans certains cas, malgré ses tendances à l’hallucination. Seuls ChatGPT o4-mini-high et Grok DeeperSearch ont montré de réels gains avec leurs modes « recherche approfondie ».

Certaines versions dites « avancées » se sont même révélées plus prudentes, voire moins précises que leurs variantes de base. Claude Sonnet, en mode pensée étendue, a fréquemment refusé de répondre, préférant rester vague plutôt que de risquer une erreur.

Forces et limites des LLMs face à Google Lens

Les LLMs surpassent souvent Google Lens en milieu urbain ou lorsqu’ils disposent de textes à analyser. Leur capacité à combiner architecture, végétation, style de signalisation ou même objets partiels (comme un logo sur un gilet de sauvetage) leur permet des inférences détaillées.

Mais les hallucinations persistent, notamment sur les images éphémères ou modifiées récemment. Plusieurs modèles ont ainsi localisé une plage avec une grande roue temporaire sur un site plus populaire mais erroné. Les biais issus de l’historique utilisateur ou des données de profil sont aussi à surveiller.

Enfin, l’analyse vidéo reste hors de portée pour la plupart des modèles, tout comme la gestion précise des coordonnées GPS. Dans l’état actuel, ces IA ne sont pas infaillibles, mais leur rythme de progression annonce des usages prometteurs pour la recherche en sources ouvertes et les enquêtes OSINT.

Pour en savoir plus

Les LLM maîtrisent-ils enfin la géolocalisation ?

Une rue ambiguë, un champ fraîchement fauché et un véhicule blindé stationné figuraient parmi les photos d’exemple que nous avons choisies pour mettre au défi les grands modèles de langage (LLM) d’OpenAI, Google, Anthropic, Mistral et xAI de les géolocaliser. Retour en…

Lire la suite sur bellingcat
Les LLM maîtrisent-ils enfin la géolocalisation ?

(Re)découvrez également:

Comment géolocaliser une équipe de programmation de missiles avec une photo

Voici encore un exemple de la puissance de renseignements rendue possible en combinant quelques photos

Lire la suite sur dcod.ch
Comment géolocaliser une équipe de programmation de missiles avec une photo

Zéro paywall. Zéro pub.
DCOD reste en accès libre grâce à vos contributions. Chaque café compte.

☕ Je participe
Etiquettes
  • ChatGPT
  • Claude
  • Google Lens
  • Grok
  • hallucination
  • LLM
Marc Barbezat

Fondateur et éditeur de DCOD - Restons en contact !

A lire également
Couverture du rapport ANSSI Panorama de la cybermenace 2025 par DCOD.ch. Visuel symbolisant les risques de sabotage et d'instabilité numérique avec une tour de blocs chutant sur fond de mappemonde en données binaires.
Lire l'article

Cybermenace 2025 : l’ANSSI dresse un bilan sous haute tension

Illustration de la sécurité des agents IA montrant un robot sur un ordinateur avec un symbole d'alerte et le logo du NIST.
Lire l'article

Agents IA : le NIST impose ses premiers standards de sécurité

Illustration conceptuelle montrant un panneau de signalisation 'Cyber Attacks Ahead' à côté d'un microprocesseur surmonté du sigle AI en hologramme bleu, symbolisant les cybermenaces liées à l'intelligence artificielle.
Lire l'article

Cybersécurité : l’IA automatise le cycle des cyberattaques

Des idées de lecture recommandées par DCOD

Cybersécurité de 0 à Expert

Vous entendez parler de cyberattaques tous les jours mais vous ne savez pas vraiment comment elles fonctionnent ? Vous voulez comprendre le monde de la cybersécurité sans jargon compliqué ni prérequis techniques ? Ce livre est votre point de départ idéal. Cybersécurité de 0 à Expert est un guide pas à pas qui vous emmène du niveau débutant jusqu’aux bases avancées, en expliquant chaque concept de façon claire et accessible.

📘 Voir sur Amazon

La cybersécurité pour les Nuls, 2ème édition

Ce livre d'informatique pour les Nuls est destiné à tous ceux qui veulent en savoir plus sur la cybersécurité. A l'heure où protéger ses données personnelles est devenu primordial sur le net, notre ouvrage vous donne les clés pour éviter le hacking et le vol de vos données. Quelque soit votre niveau en informatique, n'hésitez plus et naviguez sur le web en toute sérénité grâce à ce livre pour les Nuls !

📘 Voir sur Amazon
Page frontale du livre Cybersécurité : tests d’intrusion des systèmes d’informations web

Cybersécurité : tests d’intrusion des systèmes d’informations web: Le guide des vulnérabilités web

Amplifiez vos compétences en cybersécurité avec ce guide exhaustif sur le pentesting et le bug bounty ! Conçu pour les pentesters, les bug hunters, les développeurs, et en fait toute personne curieuse de plonger dans le monde fascinant de la cybersécurité.

📘 Voir sur Amazon

🛒 Les liens ci-dessus sont affiliés : en commandant via ces liens, vous soutenez la veille DCOD sans frais supplémentaires 🙏

💡

Note : Certaines images ou extraits présents dans cet article proviennent de sources externes citées à des fins d’illustration ou de veille.
Ce site est indépendant et à but non lucratif. 👉 En savoir plus sur notre cadre d’utilisation.

DCOD | Cybersécurité • IA • Tech DCOD | Cybersécurité • IA • Tech
  • Marc Barbezat
  • À propos de DCOD / Contact
  • Politique de confidentialité
Veille stratégique Cybersécurité, IA & Tech. Produite par Marc Barbezat.

Input your search keywords and press Enter.

DCOD est 100% indépendant
Vos cafés financent l'hébergement et les outils de veille. Merci !
Offrir un café ☕
☕

Un café pour DCOD ?

DCOD est un site 100% indépendant, maintenu en accès libre grâce à ses lecteurs.
Si cette veille cyber vous est utile, un simple café aide à couvrir les frais techniques.

☕ Offrir un café