Comme on le sait dans le monde entier, le gouvernement chinois applique censure stricte sur Internet . Le système de censure chinois, communément connu sous le nom de grand pare-feu de Chine, est géré par le ministère de la Sécurité publique et est officiellement nommé le Projet Bouclier d'or . Le système est opérationnel depuis 2003.
Sites d'actualités internationaux qui contiennent généralement du contenu politiquement sensible, comme le New York Times , ou des sites de réseaux sociaux qui ne respectent pas les règles de censure, comme Facebook et Twitter , sont généralement bloqués et indisponibles pour les utilisateurs chinois. Ceci est accompli en utilisant un variété de méthodes sophistiquées .
Pour les sites d'information et de médias sociaux chinois, pratiquement tout est sous la surveillance du gouvernement. Pour être autorisés à opérer, les FAI et les fournisseurs de contenu Internet en Chine ont généralement leur propre mécanisme de filtrage de contenu pour bloquer ou supprimer le contenu publié par ses utilisateurs, ou même pour supprimer directement le compte des utilisateurs s'ils sont considérés comme illégaux en vertu de la politique gouvernementale. Ces entreprises disposent de leur propre logiciel de censure sur leurs serveurs, ainsi que d’équipes ou de services spéciaux pour gérer manuellement les tâches de censure que les logiciels de censure automatisée ne peuvent pas gérer. Ces équipes coopèrent avec les divisions locales du ministère de la Sécurité publique, reçoivent les nouvelles commandes et politiques et travaillent généralement ensemble.
Pour notre domestique développeurs web , la censure de l'internet chinois filtre non seulement notre liberté d'expression, mais également des ressources professionnelles précieuses du monde entier. Dans mon travail quotidien, je dois contourner la censure sur Internet pour me connecter via VPN afin d'utiliser Gmail, Dropbox et de nombreux autres sites cruciaux. Je me souviens encore à quel point c'était gênant en 2010, lorsque les services de Google sont devenus instables ou inaccessibles en Chine après Google a refusé de continuer à se conformer aux règles de censure . Ce serait incroyable pour les développeurs d'autres pays.
Sina Weibo est le plus grand site de réseau social de micro-blogging en Chine. Étant donné que Twitter ne respecte pas les règles chinoises, Weibo n’a pas à lui concurrencer pour les utilisateurs. Les nouvelles se propagent plus rapidement et directement sur Weibo que sur tout autre média en Chine. Les membres des jeunes générations, comme moi, aiment l'utiliser pour partager des nouvelles et discuter d'événements publics. Mais bien sûr, sous la censure chinoise sur Internet, de nombreux messages chauds ou intéressants sont supprimés immédiatement après leur publication. Les publications sur les événements politiques et publics sont les plus susceptibles d'être supprimées, tandis que les actualités sur le divertissement sont les moins susceptibles d'être supprimées. UNE Étude 2013 par les informaticiens Jed Crandall et Dan Wallach ont constaté qu'environ 12% des microblogs chinois sont supprimés chaque jour.
Les jours politiquement sensibles comme 4 juin , on s'attend à ce qu'un plus grand nombre de messages censurés dans le microblog soient supprimés. Ces jours-là, les utilisateurs ne peuvent généralement même pas saisir certains mots sensibles lorsqu'ils tentent d'écrire un microblog.
À quoi cela ressemble-t-il lorsqu'un message est censuré? Lorsque vous actualisez un nouveau microblog sur le site, vous verrez souvent quelque chose comme ceci:
C'est l'équivalent d'un retweet, où le message d'origine apparaît généralement dans la zone grise. La boîte indique maintenant «Désolé. Le microblog a été supprimé. S'il vous plaît voir… »Le message original était un plaidoyer pour la justice par une mère, pour l'enlèvement, le viol et la prostitution forcée de sa fille de 11 ans en 2013.
2013 est une année où de nombreux scandales politiques ont été révélés via la plateforme de microblog. La popularité de Sina Weibo a explosé pendant cette période. En réponse, le gouvernement est devenu nerveux et a commencé à renforcer sa censure sur la plateforme de médias sociaux.
Avant le microblog, les jeunes comme moi qui s'intéressaient à la politique devaient généralement utiliser des serveurs proxy ou des services de tunnel pour traquer les informations sensibles sur les sites Web internationaux. Du coup, nous avions une plateforme de réseau social chinois relativement ouverte. Mais le gouvernement est intervenu rapidement, et cela s'est avéré être juste un éclair dans la casserole. Cela m'a vraiment exaspéré. J'ai parlé avec des amis et nous étions tous en colère contre le renforcement de la censure sur la plateforme. Mes amis me demandaient: «Pourquoi ne pouvons-nous rien faire à ce sujet?» J'ai décidé d'essayer. J'ai donc créé un site Web pour commencer à contourner la censure sur Internet pour voir exactement ce qui était bloqué ou supprimé de Sina Weibo.
Fondamentalement, j'avais besoin de mettre en place un serveur qui recherchait constamment les microblogs chinois bloqués ou supprimés et les montrait sur un nouveau site Web. J'avais prévu d'utiliser un service cloud domestique comme Aliyun , mais il s'avère qu'il existe de nombreuses contraintes sur la plate-forme, telles que la redirection de domaine, et que leurs prix ne sont pas moins chers que les autres services cloud. Bien sûr, ma préoccupation supplémentaire était que le serveur lui-même serait sous surveillance si je le déployais au pays. J'ai donc fini par acheter un serveur sur Linode et localisé le serveur au Japon. J'ai aussi acheté le domaine freeweibo.me pour commencer à contourner la censure de Sina Weibo.
Le graphique suivant montre l'architecture globale du système: MongoDB, un serveur Web et un robot d'exploration. J'ai choisi Node.js pour l'environnement de développement, car il est plus efficace et évolutif pour les applications réseau et, personnellement, j'ai plus d'expérience avec lui. Le serveur Web a été développé à l'aide du framework Express.js et a utilisé le API Weibo pour capturer des données. Au départ, le robot d'exploration a été conçu pour être un processus distinct, mais plus tard, j'ai trouvé que le regrouper en tant que module dans le processus du serveur Web était suffisant pour la première étape.
Le contenu d'un microblog a deux grands intérêts. Le premier concerne les données textuelles et leurs attributs pertinents. L'autre concerne les images affiliées à la publication. Pour enregistrer un article, nous voulons également télécharger les images et les enregistrer sous forme de fichiers sur le disque. Pour les blogs bloqués ou supprimés, ces images sont très importantes. En Chine, il est très courant et populaire d'utiliser des images pour publier du contenu textuel, car ce contenu est beaucoup plus difficile à capturer avec le filtrage et la censure automatisés basés sur le texte sur les serveurs des sociétés Internet.
L'idée de base de la détection des publications bloquées ou supprimées est de rechercher en permanence de nouvelles publications, à partir d'une liste d'utilisateurs connus, puis de revérifier la disponibilité des publications ultérieurement. Un microblog peut être supprimé ou bloqué en quelques minutes ou plusieurs jours. Ainsi, le robot d'exploration se compose de deux tâches principales: la tâche de récupération, pour récupérer le contenu nouvellement publié, et la tâche de vérification, pour vérifier si le contenu précédemment publié a été censuré.
Au début, j'ai configuré le robot d'exploration pour qu'il explore les microblogs des 100 meilleurs utilisateurs connus sur Weibo. Mais il s'est avéré que presque aucun blog supprimé n'était détecté chaque jour. La raison en est que la plupart des principaux utilisateurs ne s'intéressent pas aux sujets politiques ou publiquement sensibles - ils ne publient ni ne transmettent jamais ce type de microblogs. Par exemple, ce blogueur , qui est une actrice avec plus de 10 millions d'abonnés, est l'une des utilisatrices les plus populaires, mais elle ne publie jamais de blogs sensibles.
Après quelques expérimentations et réflexions, j'ai mis au point une technique pour trouver de manière adaptative les utilisateurs qui sont systématiquement censurés. Le réseau de médias sociaux est interconnecté entre les sujets et les utilisateurs ont tendance à se regrouper par centres d'intérêt. Si un utilisateur s'intéresse à des sujets publics ou politiques, il est plus susceptible de publier ou de transférer des blogs d'autres utilisateurs similaires. Ces messages transférés constituent un bon moyen d'identifier les nouveaux utilisateurs à analyser.
Par exemple, supposons que l'utilisateur A soit déjà dans la base de données et que le robot détecte qu'un blog, qui a été republié par l'utilisateur A, est supprimé. Si l'utilisateur B, l'auteur original du blog, n'est pas dans la base de données, le robot va sauver l'utilisateur B. La prochaine fois, lorsque le robot analyse à nouveau les nouveaux blogs, il analyse également les nouveaux blogs de l'utilisateur B. Ainsi, la quantité de les utilisateurs scannables grandiront automatiquement en exploitant ce type de connexion d'intérêt social.
Après avoir réglé l'algorithme du robot d'exploration pour tirer parti de cette méthodologie, je n'avais besoin que de semer plusieurs utilisateurs clés qui avaient un intérêt marqué pour la publication de blogs sensibles et le robot d'exploration a automatiquement découvert de nouveaux utilisateurs à analyser. Le nombre total de blogs censurés quotidiens qui ont été détectés a augmenté régulièrement de jour en jour. Ce qui suit est un instantané des blogs supprimés archivés dans ma boîte aux lettres.
Après deux semaines de codage et de débogage de mon système de contournement de microblog chinois, j'ai déployé le site sur freeweibo.me . Cependant, après plusieurs semaines consécutives, le serveur n'a plus détecté de nouveaux blogs. Après quelques recherches, j'ai trouvé deux problèmes. La première était que la plate-forme Weibo avait changé son interface API d'origine. L'autre était que les demandes d'API du robot dépassaient la limite de débit (1 000 par minute) en raison de l'augmentation du nombre de blogs et d'utilisateurs dans la base de données. J'ai donc réglé mon code pour adopter la nouvelle interface et aussi pour diminuer le nombre de requêtes API par minute. Le robot était désormais stable.
J'ai été confronté à un dilemme sur l'opportunité d'informer ou non de nombreuses personnes sur le site. Je savais que plus il y avait de gens qui visitaient le site, plus tôt il serait reniflé par le gouvernement et bloqué. J'ai donc partagé le site uniquement avec certains de mes amis . Au départ, il n'y avait que 10 à 20 visites par jour. Mais un mois plus tard, les visites ont atteint 80 ou plus certains jours, et j'avais des dizaines d'abonnés aux courriels.
Et puis, comme je m'y attendais, le matin est venu où j'ai découvert que mon site était bloqué en Chine. Cela avait duré environ trois mois. Pour accéder au site après cela, les utilisateurs devaient utiliser un service de tunnel VPN pour visiter le site. Cela n'est pas pratique pour la plupart des internautes chinois.
Cependant, ce même jour, j'ai été soulagé et heureux de constater qu'un autre site, freeweibo.com , fournit exactement le même service et est plus sophistiqué que ce que j'ai construit. Le projet freeweibo.com est très ingénieux. Il est actif sur les réseaux sociaux et fournit différents moyens d'accéder au contenu, tels que les flux RSS, l'abonnement aux e-mails et les sites miroir pour les utilisateurs nationaux. Il a même une application mobile! Je ne sais pas qui a construit le site, mais je suis heureux que nous partagions la même vision.
simulation de monte carlo pour débutants
Compte tenu des circonstances, il était évident que mon site n'était plus très utile et je l'ai fermé plusieurs mois plus tard.
Malgré le résultat, je n’ai pas l’impression que le projet a été vain. Au contraire, c’était une expérience merveilleuse, même si elle n’a survécu que quelques mois. Cela m'a aidé à apprécier profondément la réalité de mon pays.
En Chine, pour gérer une entreprise Internet, vous devez être très prudent face à la censure, sinon vous aurez des ennuis tôt ou tard. Les sites de médias sociaux n'ont pratiquement aucun moyen de réussir s'ils ne respectent pas la censure stricte et ne font pas de compromis sur la vie privée des utilisateurs.
La freeweibo.me le code source est maintenant disponible sur GitHub Ici . Comme indiqué ci-dessus, ce code source n'est pas lié au site Web similaire freeweibo.com .