Les cartographies d'Internet sont-elles des impostures ?

Elles sont le plus souvent graphiquement « apétantes », ou « aspirationnelles ». Les cartographies d’Internet sont une représentation graphique d’un imaginaire et répondent au besoin très humain de visualiser quelque chose d’abstrait. C’est sans doute pour cela que leurs créateurs y passent autant de temps. Leur cible les accueilleront avec intérêt. C’est un bon moyen de faire un peu de buzz. Mais que représentent véritablement ces cartographies ?

En fait, pas grand chose…

Que mesure-t-on ? Une zone d’influence des GAFA en fonction du nombre de liens, de visiteurs ? Le nombre de machines connectées au réseau ?

Dans ce dernier cas (comme dans le premier), cela pose un véritable problème.

Internet est « le réseau des réseaux ». Cette terminologie s’explique bien entendu parce qu’Internet est LE réseau. Le plus gros. Mais aussi une agrégation de réseaux. Des plages d’adresses IP, pour être précis. Une cartographie à peu près précise pourrait être – dans l’absolu – le résultat du comptage des des adresses IP utilisées par des machines.

Mais comment prendre en compte les adresses IP dynamiques ? Celles qui sont attribuées un jour à une machine, un autre à une Box et le lendemain à un téléphone portable ou une tablette ? Combien de machines pour une seule adresse IP. Est-ce que le nombre d’IPs utilisées reflète le nombre de machines connectées ? Pire, impossible de savoir avec précision combien de serveurs tournent sur ces machines. Un serveur Web ? Cent ? Combien de serveurs FTP, et même pourquoi pas de serveurs Gopher, Telnet ? Combien de machines derrière un Proxy, derrière un Firewall qui filtre certains ports, interdisant de fait une cartographie précise (Gr33tz Fyodor) ?

Autonomous System (comme son nom l’indique…)

Le réseau des réseaux, cela implique également que chacun est maître de sa partie du réseau, de celle qu’il administre. En d’autres termes, SFR ne peut pas savoir avec précision quels sont les serveurs, quelles sont les machines installées chez Free ou chez Google.

Il serait théoriquement possible de compter le nombre d’adresses IP en déterminant le nombre d’adresses possibles pour chaque Autonomous System (AS). Le protocole BGP est là pour aider celui qui voudrait se lancer dans cette tâche. Mais cela ne dirait pas grand chose non plus sur le nombre de machines actives (accès non bloqué par un firewall par exemple), sur le nombre de services installés, sur leur pérennité…

Autre souci évident, la pérennité des données récoltées. Une cartographie d’Internet, même dans le cas où elle aurait une quelconque once de précision, serait obsolète dans les minutes qui suivraient sa mise à disposition. Il faudrait re-scanner en permanence – pour ne pas dire en temps réel – les réseaux qui composent le Net pour qu’une cartographie soit le plus proche possible de la réalité.

Et dans tous les cas, elle en serait très éloignée.

NMAP et le Botnet…

L’une des expériences de mapping d’Internet les plus intéressante a consister à créer un botnet (gentil et poli) et à utiliser NMAP. En d’autres termes, repérer un grand nombre de machines mal paramétrées (avec des crédentiels de type admin/admin) et de les utiliser pour répartir une vaste opération de scan de plages d’adresses IP à l’aide de NMAP.

L’Internet Census 2 date de 2012, mais le principe adopté mérite lecture. Et comme pour toute cartographie d’Internet qui se respecte, on obtient de très belles images colorées et/ou animées :