mercoledì 15 dicembre 2004

nuovi strumenti per la ricerca

Reubblica.it
Il motore di ricerca si accorda con cinque grandi biblioteche Usa

per mettere su internet i loro volumi. Iniziativa senza precedenti
Nuovo colpo di Google
Porta online milioni di libri
Tra le istituzioni coinvolte, Harvard, Oxford e Stanford

ROMA - L'informazione globale passa sempre di più attraverso un solo nome: Google, il più famoso di ricerca mondiale, ha appena annunciato un accordo con cinque delle più importanti biblioteche statunitensi per digitalizzare e mettere a disposizione online milioni di volumi, alcuni dei quali di particolare pregio e rarità.
Il progetto coinvolge le biblioteche univeristarie di Harvard, Oxford e Stanford, quella dell'università del Michigan e la New York Public Library. Per trasformare i testi, alcuni dei quali sono vecchi di secoli, dal formato cartaceo a quello digitale, Google ha dichiarato di utilizzare una tecnologia di sua proprietà. Secondo quanto riportato dal San Jose Mercury News, la compagnia ha già attrezzato con scanner e computer una stanza dell'università del Michigan, dove il processo di digitalizzazione va avanti fin da giugno.
L'intero procedimento potrebbe protrarsi per anni. I libri, comunque, verranno inseriti nel già enorme indice di Google man mano che vengono scannerizzati. A quanto si apprende, i testi di pubblico dominio, saranno a disposizione gratuitamente di tutti i navigatori. Di quelli protetti da copyright, il motore di ricerca fornirà soltanto l'indice, la bibliografia e alcuni estratti, come già avviene per i nuovi titoli inseriti nel servizio Google Print.
Non è la prima volta che qualcuno tenta di creare un vasto catalogo online di libri. Amazon.com ha già aperto un motore di ricerca interno alla sua libreria on line che permette di consultare centomila dei libri del suo catalogo prima dell'acquisto. Anche Microsoft e Yahoo sono alla ricerca dei diritti per offrire l'accesso a materiale librario in cambio di pubblicità. La stessa Google, il mese scorso, aveva lanciato Scholar, un indice di pubblicazioni accademiche separato dai normali risultati per garantirne l'affidabilità.
Ma l'iniziativa annunciata oggi è senza precedenti sia per la vastità dell'operazione, sia per il prestigio dei soggetti coinvolti.
Non tutte le biblioteche inserite nell'accordo contribuiranno in egual misura all'operazione: Stanford metterà a disposizione 2 milioni di testi, l'università del Michigan (dove studiò Larry Page, uno dei cofondatori del motore di ricerca) ben 7 milioni. Harvard sottoporrà agli scanner di Google solo 40 mila volumi, almeno fin quando non sarà accertato senza dubbio che la procedura di digitalizzazione non rischia di rovinare i libri più preziosi e fragili.
Entusiasti i primi commenti degli interessati: "Google sta facendo una cosa meravigliosa per la comunità accademica", ha affermato Peter Kosewski, direttore delle pubblicazione e della comunicazione ad Harvard. "Questo progetto", gli ha fatto eco John Wilkin, uno dei bibliotecari della Michigan, "dà accesso a una quantità di materiale in una maniera che nessuno di noi avrebbe mai creduto possibile". E Michael Keller, direttore della bibliteca di Stanford, profetizza: "Nello spazio di due decenni lo scibile umano sarà digitalizzato e accessibile per la lettura su Internet, così come adesso è accessibile gratuitamente nelle biblioteche".

L'ANALISI
Ma com'è utile Google Scholar
tanta scienza, poco rumore
di VITTORIO ZAMBARDINO

Uno all'inizio non ci crede. Nei suoi ultimi passi Google non era stato l'Oscar della simpatia: con il suo servizio desktop, prontamente seguito dagli altri concorrenti, aveva eletto a servizio web il Ficcanaso tecnologico. E quindi l'annuncio di Google Scholar
(http://scholar.google.com) è passato per qualche ora sotto silenzio da più parti. Ora però l'abbiamo provato. E' un servizio straordinario, anche se ancora in fase di collaudo, è una novità assoluta e inimitabile, soprattutto se reso sinergico usandolo con le altre capacità. Di ricerca del motore.
La nuova funzione permette di cercare parole-chiave dentro libri ed intere biblioteche, dentro paper di congressi di ricerche, dentro database scientifici. Tutto ciò che è conoscenza accademica, purchè sia stata messa su una pagina web.
Ho provato con tre parole: Eyetrack, Internet 2 e Serendipity. La prima si riferisce, per me (conta sempre questo: cosa significa per me la parola che inserisco, cosa sto realmente cercando), ad una ricerca condotta sugli utenti web cui è stato applicata una tecnologia che segue i movimenti degli occhi. Il rischio era che l'informazione non emergesse perché il termine si trova in molti studi di ottica e di tecnologia spaziale. L'ha "beccato" dopo appena cinque link, niente.
Se poi lancio la ricerca "normale" di Google sulla parola Eyetrack, in meno di un minuto ho una bibliografia perfetta per scriverci sopra un saggio.
Secondo tentativo. Internet 2: qui il rischio era la confusione, il rumore di fondo fra studi di diverso orientamento sulla rete di prossima generazione, la super-rete.. In effetti accade, ma se solo aggiungo alla parola cercata una specificazione, un secondo termine che restringe il campo, ecco apparire saggi accademici, tesi, paper presentati a convegni. Tempo richiesto: due minuti.
Terzo tentativo. Serendipity. Qui era una provocazione alla potenza tecnologica di Google. Perché su questo termine, che in inglese indica la capacità di trovare piacere in ciò che non si è cercato ma che si è comunque trovato era praticamente impossibile non inciampare in argomenti frivoli. Ebbene, nelle prime due schermate non vi è alcuna traccia di "rumore", il sistema ha indicato solo ricerche scientifiche - in biologia, in fisica - di alto livello.
Che dire? Con Scholar Google dà un contributo importante alla selezione dell'informazione, all'eliminazione del rumore, vale a dire alla soluzione del problema che da sempre affligge la ricerca libera sui motori. Banalizzando: è la tecnologia che si autocorregge. Seguendo invece la linea di sviluppo della società californiana, si nota il movimento che punta a creare l'ambiente dell'informazione, l'info-sistema, nel quale ho a mia disposizione ciò che gli essere umani hanno prodotto su ogni argomento. Bush, dalla tomba, sarà contento.
Che avete capito? Non il presidente, nessuno l'ha ancora ucciso, ma Vannevar Bush che su Atlantic Monthly del 1945 scrisse un saggio che è ritenuto la genesi teorica della rete. Si intitolava: How We May Think? Come possiamo pensare. Il ricercatore immaginava un complesso sistema di leve e cassetti, fatto per utilizzare quell'enorme ammasso di cooscenze scientifiche e tecnologiche che lo sforzo bellico aveva messo a disposizione degli Stati Uniti ma che non si poteva usare perché l'informazione affogava nella confusione, nel caos.
Bush capì che costruire quel sistema di ritrovamento dei dati, fondato sull'ipertesto, avrebbe cambiato la nostra testa, il nostro modo di pensare. Ma non riuscì a realizzare la sua macchina. Sessanta anni dopo, sta succedendo.

P.S. Non ricordavo il titolo esatto dell'articolo di Bush. L'ho cercato su Scholar, l'ho trovato in meno di un secondo.

Per commenti www. zetavu. it

Repubblica 15.12.04
Un accordo tra il motore di ricerca e cinque grandi strutture per "digitalizzare" milioni di libri

Repubblica 15.12.04
La superbiblioteca di Google "In rete il mito di Alessandria"

Negli scaffali virtuali i "tesori" di Harvard, Stanford, Oxford, della Michigan University e della Manhattan library
Brin e Page, fondatori del motore di ricerca, inseguono la leggenda dell´antica meraviglia della città egizia
di VITTORIO ZUCCONI

WASHINGTON - Sono stati necessari duemila anni, perchè questa fenice di carta risorgesse dall´incendio che consumò in essa le conoscenze del mondo, ed è rinata grazie a un topo di plastica. Il mito della biblioteca di Alessandria, voluta in Egitto dal conquistatore Macedone e forse distrutta da Giulio Cesare per soggiogare il regno sul Nilo, rinasce con «Google» attraverso quella Internet che mantiene finalmente la promessa di essere la memoria dell´umanità e non soltanto il grande suk di pornovideo, musica rubata, shopping di carabattole e diari della frustrazione privata.
La Google, turgida di miliardi dopo il colpo del suo ingresso trionfale in Borsa, investirà la propria tecnologia di ricerca on line e soprattutto centinaia di milioni propri per mettere a disposizione degli utenti le biblioteche delle massime università del mondo e sempre gratis. Il sogno di poter sfogliare da casa o dal luogo di lavoro i tesori contenuti a Harvard, a Oxford o alla New York Public Library si avvera e diviene praticabile, grazie al motore di ricerca creato dai due fondatori di Google e alle sempre più forti velocità dei collegamenti.
Calcolano gli archeologi polacchi ed egiziani che sostengono di avere finalmente trovato nel maggio di quest´anno le rovine della biblioteca di Alessandria, che nelle sue grandi e allora ineguagliate sale di lettura, cinquemila persone potessero consultare contemporaneamente le opere di Euclide sulla geometria e gli studi di Tolomeo sull´universo, magari sfiorando un Archimede intento a inventare la prima pompa moderna per acqua all´ombra del Pharos, il faro marittimo, una delle sette meraviglie del mondo. Cinquemila utenti erano molti, per quella prima «rete» di pietra e di papiro, e sono nulla di fronte agli 850 milioni di esseri umani che oggi, secondo le statistiche più aggiornate, hanno accesso a Internet nel mondo, dall´Europa (231 milioni) al Nord America (222 milioni), dall´Asia, con i suoi 257 milioni al Medio Oriente, dove soltanto 17 milioni di persone la possono usare, in una delle statistiche più deprimenti sull´arretratezza di quella regione.
A questo miliardo di persone, quante diventeranno nei prossimi due anni necessari per digitalizzare i primi scaffali, ora si apriranno le porte di Harvard, di Stanford, della Michigan University con la sua eccellente facoltà di giurisprudenza, di Oxford, della Biblioteca municipale di Manhattan e progressivamente di tutte le biblioteche e università del mondo che vorrano aggiungersi a queste che hanno firmato per prime l´accordo con il russo Sergej Brin e con l´americano Larry Page, i due co-fondatori di Google.
Già oggi, attraverso la banca dati pubblica della Libreria del Congresso di Washington, la più completa al mondo, o utilizzando l´eccellente sito commerciale di amazon. com, che fornisce estratti e recensioni di quasi tutti i volumi in vendita, chi vuole può annusare e assaggiare la produzione libraria nel mondo. Ma la promessa di Brin e Page, che si sono trovati circa un miliardo di dollari in tasca ciascuno quando il titolo della Google, offerto inizialmente a 85 dollari, ha superato i 200 prima di riassestarsi attorno ai 175, è di mettere a disposizione i testi completi di ogni libro pubblicato e conservato. Gratis.
E´ un´impresa colossale, degna dei miti e delle meraviglie millenarie ai quali i due si sono ispirati e che altri motori di ricerca inevitabilmente seguiranno, a cominciare da quella Microsoft che, forte del proprio quasi monopolio nei sistemi operativi Windows, fu già sopresa a dormire di fronte all´esplosione del fenomeno Internet e poi si è fatta distanziare da Yahoo e poi da Google negli indispensabili «motori di ricerca», senza i quali navigare nel «World Wide Web», nella rete mondiale, è come attraversare oceani senza carte e senza timone. Molte volte era stato promesso di spalancare gli scaffali delle biblioteche a tutti, ma la difficoltà di «digitalizzare», cioè di copiare in un formato utilizzabile via computer, miliardi di pagine stampate, e poi di sfogliarle con i limiti della tecnologia lenta di ieri, avevano riservato gli accessi a specialisti e ricercatori pazienti e decisi.
«Questo era uno dei nostri sogni fin da quando creammo l´algoritmo (la formula algebrica) che sta alla base di Google» spiegava ieri Page, l´americano fuoricorso all´Università di Stanford, vicina di casa della loro sede a Silicon Valley «e quando la gente ci rideva dietro, noi ci restavamo male». «La nostra missione - gli fa eco Brin, lo studente russo immigrato da Mosca - è sempre stata quella di offrire un accesso universale alla conoscenza accumulata dall´umanità e organizzare in maniera semplice, accessibile e intuitiva l´informazione globale». «Globale» è naturalmente una parola che non può mancare nella semantica del nostro tempo e se la missione di Brin e Page è sicuramente nobile e ambiziosa, quasi rinascimentale nel mecenatismo da nuovi ricchi che vogliono fare qualcosa di importante per l´umanità dopo avere accumulato fortune, i due non sono suore missionarie. Se davvero Google diverrà la nuova Biblioteca di Alessandria elettronica per il mondo, gli accessi al loro sito già oggi dominante si moltiplicheranno, rendendolo ancora più appetibile per chi già deve pagare per essere elencato e menzionato tra i risultati delle loro ricerche, perchè questo è il «business model», il meccanismo dei profitti della società.
Se a qualcuno riuscirà dunque l´impresa di catalogare e rendere accessibile a chiunque tutto ciò che è stato scritto e pubblicato nella storia umana, questo qualcuno è la Google, che promette di avere già 70 mila libri «on line» per la fine del prossimo aprile. Dovranno assumere migliaia di collaboratori, perchè buona parte del processo di «digitalizzazione» dei testi è fatto a mano e nella loro fatica, con gli almeno 270 milioni di dollari stanziati inizialmente da «Google» nascerà una nuova figura di «topo di biblioteca». Non più lo studioso occhialuto o il libraio diligente, ma il magico «mouse», il topolino di plastica che potrà fare di ogni cittadino del mondo uno studente di Oxford o di Harvard, nella nuova democrazia della conoscenza strappata ai templi esclusivi e inaccessibili del sapere.