Powered By Blogger

Rechercher sur ce blogue

Aucun message portant le libellé Deep web search engine Memex. Afficher tous les messages
Aucun message portant le libellé Deep web search engine Memex. Afficher tous les messages

dimanche 15 juillet 2018

Google Blacklists des millions d'URL de pirate avant leur indexation



Google conserve une liste en croissance rapide d'URL contrevenant aux droits d'auteur, qu'ils n'ont pas encore répertoriées. Cette liste noire garantit que ces liens ne sont jamais ajoutés au moteur de recherche. Grâce à une nouvelle mise à jour du rapport de transparence, nous savons désormais combien de liens non indexés sont inclus dans chaque notification de retrait, ce qui est étonnamment élevé dans certains cas.Ces dernières années, Google a dû faire face à une augmentation continue des demandes de retrait ciblant les sites piratés dans les résultats de recherche.Le nombre total d'URL supprimées vient d'atteindre 3,5 milliards et des millions d'autres sont ajoutés chaque jour.Bien que ce ne soit pas nouveau, Google a commencé à partager quelques informations supplémentaires sur la nature de ces demandes.Il s'avère que des millions, voire des centaines de millions de liens ciblés par les détenteurs de droits d'auteur n'ont jamais figuré dans l'index de recherche de Google.Plus tôt cette année, le conseiller en droit d'auteur de Google, Caleb Donaldson, a révélé que la société avait commencé à bloquer les liens non indexés de façon prophylactique, en d'autres termes, Google bloque les URL avant qu'elles n'apparaissent dans les résultats de recherche."Google a considérablement élargi l'avis et le retrait d'une autre manière importante: Nous acceptons les avis pour les URL qui ne sont même pas dans notre index en premier lieu. De cette façon, nous pouvons collecter des informations même sur les pages et les domaines que nous n'avons pas encore explorés ", a noté Donaldson."Nous traitons ces URL comme nous faisons les autres. Une fois que l'une de ces URL non-indexées est approuvée pour retrait, nous l'empêchons d'apparaître dans nos résultats de recherche, "a-t-il ajouté.Malheureusement, Google n'a pas fourni de moyen facile de voir combien de liens dans une requête n'étaient pas indexés, mais cela a maintenant changé.

Au cours de la dernière semaine, le moteur de recherche a ajouté un nouveau signal à son rapport de transparence DMCA indiquant combien d'URL soumises dans un avis ne sont pas encore indexées. Dans certains cas, c'est la grande majorité.
En moyenne, Google traite plus de trois millions de notifications de retrait de la part des détenteurs de droits d'auteur, et ce uniquement pour son moteur de recherche.En vertu de la législation DMCA en vigueur, les fournisseurs de services Internet basés aux États-Unis sont censés supprimer les liens de contrefaçon, si un détenteur de droits d'auteur se plaint.Ce processus protège ces services de la responsabilité directe. Au cours des dernières années, il y a eu beaucoup de discussions sur l'efficacité du système, mais Google a toujours soutenu que cela fonctionne bien.



Prenez la branche mexicaine sur le groupe anti-piratage APDIF, par exemple. Cette organisation est l'un des journalistes DMCA les plus actifs et a demandé à Google de supprimer plus d'un million d'URL la semaine dernière.Comme on peut le voir ci-dessous, la majorité des liens semblent être des liens non indexés. Nous avons parcouru des douzaines de listes récentes d'APDIF et celles-ci révèlent un modèle où, dans la plupart des cas, plus de 90% des URL soumises ne sont pas dans les résultats de recherche de Google.Google signale désormais les demandes de retrait non indexéesCes URL ne sont évidemment pas supprimées car elles n'étaient pas répertoriées. Selon la déclaration précédente de l'entreprise, ils sont placés sur une liste de blocage distincte à la place, ce qui les empêche d'être ajoutés à l'avenir.L'APDIF n'est pas le seul reporter à le faire. Rivendell, l'expéditeur le plus actif de tous, a également un taux élevé de liens non indexés, souvent bien supérieurs à 50%.La tactique s'avère plutôt commune. Des acteurs bien connus tels que Fox, Walt Disney, NBC Universal, BPI et la RIAA, signalent également des liens non indexés, à des degrés divers.Toutes les agences d'évaluation n'ont pas des taux aussi élevés que l'APDIF. Cependant, il est clair que des millions d'URL de pirate non indexées sont ajoutées chaque mois à la liste de blocage préemptive.Techniquement, le processus de retrait DMCA est destiné aux liens et au contenu qui existent réellement sur un service, mais il semble que cela ne dérange pas Google d'aller plus loin.TorrentFreak a contacté le géant de la recherche il y a quelques jours, espérant trouver le pourcentage de demandes globales qui ne figurent pas dans les résultats de recherche de Google, mais au moment de la rédaction, nous n'avons pas encore reçu de réponse.


REF.:

vendredi 13 février 2015

Deep Web Search Engine Memex lutte contre la criminalité


Deep Web Search Engine Memex lutte contre la criminalité dans peu comme Minority Report

Deep Web Search Engine Memex Fights Crime a Bit Like Minority Report

Il y a exactement un an, la DARPA avait annoncé une mission inspiré de scienfiction : pour créer un moteur de recherche qui pourrait trouver des choses sur le web profond Que les robots de Google manqueraient. Le soi-disant projet Memex est maintenant bien engagée, et pour la première fois nous obtenons un regard sur le moteur de recherche de lutte contre la criminalité dans l'action.

Pardonnez le cliché référence Philip K. Dick, mais ressemble un peu Memex a quelque chose que vous verriez dans Minority Report. L'agence de recherche du Pentagone a proposé a Scientific American 60 Minutes , un look exclusif de la technologie, et les caractéristiques son absolument hallucinante.

Sur le plan de surface, Memex fonctionne comme un moteur de recherche qui étend ses tentacules dans le web profond et Darknet. Depuis les goûts de Google et Bing ,indice seulement environ 10 pour cent du web, cette fonctionnalité de base est essentielle pour suivre les mouvements criminels, en particulier ceux des trafiquants d'êtres humains qui maintiennent le plus bas profils.

Alors, prenez ce scénario: Si un enquêteur criminel a un lien vers une annonce postée par un trafiquant d'êtres humains, l'enquêteur aurait du mal à trouver d'autres indices depuis les trafiquants d'êtres humains tirez des annonces avant que Google a une chance de les indexer. Memex contourne cela.

La technologie de prochaine génération aux questions beaucoup plus large échantillon de l'Internet, y compris profonde web et des liens darknet, de trouver des liens entre le terme de recherche et ses résultats, sans parler des liens entre les résultats.

Après la recherche initiale, Memex produira alors un soi-disant
"date de réveil" qui montre toutes les autres pages qui sont liées à des liens que vous avez cliqué sur, mais ne pourriez pas voir autrement. Il ressemble à ceci:

Deep Web Search Engine Memex lutte contre la criminalité un peu comme Minority Report

Deep Web Search Engine Memex Fights Crime a Bit Like Minority Report
C' est juste un truc. Les robots d'indexation suralimentés sont anche en mesure de suivre les mouvements des trafiquants d'êtres humains en regardant où ils soumettre . Encore une fois, ce sont des liens qui ne peut se glisser à travers les pistes de Google. Les mouvements peuvent être compilés dans les cartes de chaleur ou des cartes des mouvements d'un criminel:


Deep Web Search Engine Memex Fights Crime a Bit Like Minority Report






Deep Web Search Engine Memex lutte contre la criminalité un peu comme Minority Report

Les choses deviennent vraiment futuriste quand vous prenez en compte la dernière fonction Memex. La technologie est actuellement testé en version bêta par deux bureaux d'avocats de district, un organisme d'application de la loi et une organisation non gouvernementale. Les prochaines étapes de tests, deux pour commencer avec un groupe plus large des bêta-testeurs dans quelques semaines, est l'endroit où les choses commencent à ressembler beaucoup plus à Minority Report. De Scientific American:

     L'un des principaux objectifs de ce cycle est de tester de nouvelles capacités de recherche de l'image qui permet d'analyser les photos même lorsque des parties qui pourraient aider les enquêteurs, y compris les visages des trafiquants ou un écran de télévision en arrière-plan sont-obscurcis. Un autre objectif est d'essayer différentes interfaces utilisateur et d'expérimenter avec des architectures de streaming qui évaluent les données sensibles au facteur temps.

Vous avez entendu ce droit. DARPA veut attraper les criminels en regardant les reflets sur les écrans de télévision, de la même façon Tom Cruise que les chiffres sur les détails de crimes avant qu'ils ne surviennent. Bien sûr, Memex ne peut pas voir dans l'avenir. Cependant, l'idée est que la technologie se arrêtera trafiquants d'êtres humains avant qu'ils ne blessent plus de personnes . Tous qu'a besoin le DARPA maintenant ,ce sont des gants étranges, un écran de taille d'une pièce, et certains mutants, les humains prophétiques de trempage dans une chambre spéciale, et l'agence sera enfin une réalité sur la vision de Philip K. Dick de Minority Report. [Sciam, 60 Minutes]



Source.: