[PLAYERS] Paola Tubaro : big data, nos traces digitales au service de la recherche

Vignette de la vidéo Piste de sous-titres Vidéos en relations
<embed src="http://www.sfr.com/sites/all/themes/sfr/swf/player.swf" flashvars="file=http://ncdn-video.sfr.com/paolatubaro/video.mp4" width="600" height="335" />

JWplayer | paolatubaro

Le 08 / 02 / 13 | Posté par la rédaction de SFR PLAYER
[PLAYERS] Paola Tubaro : big data, nos traces digitales au service de la recherche

Que peuvent apporter les données aux scientifiques ?

SFR PLAYER donne la parole à Paola Tubaro, chercheuse au CNRS et maître de conférence à l’université de Greenwich à Londres. Elle nous explique les changements induits par l’utilisation du big data dans son travail de sociologue.

Pour aller plus loin :

Découvrez notre article "néo-sciences"

Découvrez les interviews de Jean-Baptiste Michel (chercheur en biologie et mathématiques à Harvard) et Paola Tubaro (chercheuse au CNRS et maître de conférence à Greenwich Londres)

Illustration Label Tania

Transcript vidéo

Paola Tubaro, maître de conférences à l’université de Greenwich, Londres, et chercheuse au Centre national de la recherche scientifique (CNRS)

Bonjour, je suis Paola Tubaro. Je suis maître de conférence à l’université de Greenwich, à Londres, où je m’occupe surtout de l’analyse des réseaux sociaux. Je suis aussi chercheuse au CNRS, ici à Paris, et en particulier ici. Nous sommes à l’école normale supérieure à Jourdan, un lieu où se trouve une partie du service français de mise à disposition des données pour les chercheurs. Il s’agit de données de la statistique publique – données de l’Insee, enquêtes, données administratives –, pour l’usage en sciences sociales.

La recherche en sciences humaines sociales a toujours utilisé des données. Maintenant on a encore une évolution : le big data, les données d’Internet, les traces digitales de nos activités. Elles ont l’avantage de pouvoir être récupérées, enregistrées beaucoup plus rapidement et simplement que les anciens registres des écoles ou des hôpitaux.

Je pense que les utilisations les plus intéressantes sont celles qui ont une bonne stratégie empirique. Je veux dire, pas seulement des données de qualité, un gros volume, un grand nombre, mais une organisation intelligente de ces données et des questions qui vont avec, en particulier pour reproduire des conditions quasi expérimentales.

Je pense à deux recherches aux États-Unis. L’une était une expérience sur un forum consacré à des problèmes de santé (Patients Like Me). Ils ont regardé comment, en changeant la construction de liens sur ce forum, en favorisant plus ou moins les contacts entre les participants, des comportements de santé plus appropriés pouvaient se diffuser plus facilement. Et ils ont pu tirer des conclusions solides. Une autre étude faisait quelque chose de semblable, mais cette fois-ci sur Facebook.

La possibilité d’extraire du big data nous permet d’avoir affaire à une échelle supérieure, en situation, donc pas dans un labo, un endroit où les gens ne se comportent pas forcément comme dans la vie réelle.

J’ai travaillé sur des projets avec Antonio Casilli notamment, qu’on a appelés plutôt du « small data » que du big data. La raison en était que l’on se trouvait dans des situations où il n’était pas possible de collecter du big data, au moment ou on a voulu réagir très rapidement aux émeutes britanniques de l’été 2011 avec un papier de recherche.

Au moment ou les faits se déroulaient, on n’avait pas encore de données internet disponibles, un peu propres, pour faire une étude. C’est venu après, Twitter a mis a disposition de certains collègues des données, ils ont fait des analyses dessus, mais, pas sur le moment. Et donc ce qu’on a fait était de travailler par simulation, en utilisant Internet d’une manière un peu différente, c’est-à-dire pour collecter des retours, des avis, du feedback par des utilisateurs, des activistes, des gens qui avaient vu des choses et qui pouvaient nous faire des remarques pour améliorer notre simulation. Et ça nous a quand même permis d’intervenir très très rapidement dans un débat qui demandait des réponses immédiates, parce que Londres était en train de brûler et il fallait pouvoir dire quelque chose en tant que chercheur.

Donc en fait c’est peut-être plutôt des choses différentes qu’on va apprendre mais qui ne conduisent pas non plus à dire que ce n’est que des études en ligne qu’il faut mener à partir de demain. Ça renforce une tradition qui avait déjà commencé, sans nier les méthodes, les contextes, qui ont été utilisés auparavant. Donc je vois une évolution des deux choses en parallèle, avec des convergences et des synergies dans l’espoir qu’elles se mettront en place.