Technologies and Services for Enhanced Contents Delivery Tecnologie per arricchire e fornire accesso a contenuti

98 0 0
Technologies and Services for Enhanced Contents Delivery Tecnologie per arricchire e fornire accesso a contenuti

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Technologies and Services for Enhanced Contents Delivery Tecnologie per arricchire e fornire accesso a contenuti Fondo Speciale Innovazione 2000 “I concetti di accesso e di rete stanno acquisendo un’importanza crescente, proprio come era accaduto la nozione di proprietà e mercato agli albori dell’età moderna Sino alla fine degli anni Novanta, la parola accesso era usata solo occasionalmente, e, in genere, era riferita a questioni attinenti l’ammissione a spazi fisici determinati Oggi, accesso è uno dei termini più usati nella vita sociale: quando lo sentiamo, probabilmente siamo portati a pensare a nuovi universi di possibilità e oppportunità È diventato il titolo per accedere al progresso e alla soddisfazione personale e possiede una potenza evocativa pari a quella che, per le passate generazioni, avuto la visione democratica È un vocabolo denso di suggestioni e carico di significati politici Parlare di accesso, dopotutto, significa parlare di distinzioni e divisioni, di chi sarà incluso e chi sarà escluso L’accesso sta diventando un potente strumento concettuale per riformulare una visione del mondo e dell’economia, ed è destinato a diventare la metafora più efficace della nuova era.” da Jeremy Rifkin, L’era dell’accesso Mondadori, 2000 ISTI Fondo Speciale Innovazione Summary The project will focus on developing tools and technologies for delivering enhanced contents to final users This entails identifying relevant material from various sources, transforming it, adding to it metadata and other useful distinguishing information, organizing it and delivering the most relevant material to interested users in a timely fashion Digital and network technologies provide new means for content delivery, in particular:  Digital Libraries  Web search and delivery A number of services are provided to user for accessing the content in Digital Libaries and on the Web including: search engines, thematic catalogues, media collections (audio, video, WAP, ecc.) and advanced digital library services The project aims at developing or improving the technologies required for providing these services This goal entails meeting a number of stimulating research challenges:  Developing new algorithms for indexing and for searching compressed indexes  Exploiting high performance techniques for fast response to huge number of queries on vast amount of data  Deploying Web Mining techniques for determining:  Ranking or authority of documents  Improving spidering and caching performance  Document classification  Developing participatory search services  Developing an open architecture for distributed Digital Libraries  Exploiting XML as notation for document structuring and metadata  Providing access to multimedia documents in Digital Libraries  Expressing and processing queries on XML schemas  Advanced user services: like document annotations, notification, group work support Putting these technologies together for building the next generation of content delivery systems is an ambitious goal but vital to avoid that this new raising field be dominated by non European companies, as it has happened for the field of data bases Enhanced Content Delivery Sommario Il progetto si concentra sullo sviluppo di tecnologie e strumenti per offrire contenuti arricchiti (enhanced contents delivery) agli utenti finali Ciò consiste nell’identificare materiale digitale presente su fonti diverse, trasformarlo, organizzarlo, aggiungervi metadati e informazioni utili a qualificarlo e fare giungere agli utenti il materiale più rilevante per i loro interessi Le tecnologie di rete e digitali offrono nuovi mezzi di distribuzione di contenuti, in particolare:  Biblioteche digitali  Ricerca ed accesso sul Web I servizi di accesso offerti agli utenti di questi mezzi includono i motori di ricerca, i cataloghi tematici, le collezioni a soggetto (audio, video, WAP, ecc.) e i servizi avanzati delle biblioteche digitali In questo progetto ci si propone di sviluppare o migliorare le tecnologie necessarie per mettere in funzione questi servizi Questo obiettivo richiede di affrontare stimolanti problemi di ricerca:  Sviluppo di algoritmi per indicizzare e ricercare documenti in formato compresso  Sfruttare tecniche di High Performance Computing per fronteggiare le moli dei dati e il numero di utenti dei servizi  Sviluppo di tecniche di Web Mining per determinare:  rank o autorevolezza delle fonti  come migliorare le prestazioni di spidering e caching  come classificare i documenti  Sviluppo di servizi di ricerca partecipativa e decentralizzata  Sviluppo di un’architettura aperta per Biblioteche Digitali distribuite  Utilizzo di XML per strutturare documenti ed esprimere metadati  Fornire accesso a documenti multimediali nelle Digital Libraries  Formulare e rispondere a interrogazioni su schemi XML  Sviluppare servizi avanzati per gli utenti quali: annotazioni di documenti, notifica, supporto al lavoro di gruppo Combinare queste tecnologie per costruire i sistemi di prossima genernazione per arricchire e fornire accesso a contenuti è un obiettivo ambizioso ma strategico per evitare che questo settore emergente sia dominato da aziende non europee, come è avvenuto per un settore altrettanto vitale quale quello dei database Fondo Speciale Innovazione Oggetto Il progetto si concentra sullo sviluppo di tecnologie e strumenti per offrire contenuti arricchiti (enhanced contents delivery) agli utenti finali Ciò consiste nell’identificare materiale digitale presente su fonti diverse, trasformarlo, organizzarlo, aggiungervi metadati e informazioni utili a qualificarlo e fare giungere agli utenti il materiale più rilevante per i loro interessi Le tecnologie di rete e digitali offrono nuovi mezzi di distribuzione di contenuti, in particolare:  Biblioteche digitali  Ricerca ed accesso sul Web Le biblioteche digitali contengono materiali in vari media, tradizionalmente raccolti ed organizzati da esperti bibliotecari che li rendono disponibili tramite strumenti sofisticati di recupero di informazioni Le biblioteche digitali sono spesso orientate ad una utenza professionale, che richiede strumenti di ricerca avanzati o di compiere operazioni speciali sul materiale (ad esempio trasformazioni di digital imaging o estrazioni di testo da sorgenti audio) La ricerca sulle biblioteche digitali deve affrontare il compito di gestire e rendere coerenti, usabili ed accessibili grandi quantità di materiali La ricerca si sta orientando quindi su strumenti per la ricerca intelligente, il recupero, l’organizzazione e la presentazione; su nuovi tipi e strutture informative, su codifiche di documenti e metadati atti ad arricchirne il contesto informativo Il Web fornisce una struttura informativa distribuita, caratterizzata da flessibilità, evoluzione rapida e decentralizzazione I documenti Web mostrano un’ampia variabilità nei tipi, nel formato e nella qualità; al Web manca un’organizzazione generale anche se a volte emergono forme di auto-organizzazione (ad es cataloghi Web o raccolte tematiche) I motori di ricerca sul Web sono orientati ad utenti comuni senza particolari competenze Sia le biblioteche digitali sia il Web tendono a fornire interfacce e infrastrutture per agevolare il lavoro intellettuale (trovare, creare e disseminare conoscenze), inserendo il materiale in un contesto complessivo persistente e strutturato, nonostante la rete sottostante sia in continua evoluzione Per entrambe le infrastrutture si possono immaginare forme simili di servizi avanzati: selezione per categorie, filtraggio in base agli interessi, annotazioni di gruppo o personali, avvisi o filtri basati su profili personali degli utenti Tuttavia, mentre le biblioteche digitali trattano materiale già ben organizzato e strutturato, la ricerca su Web deve trattare una varietà di materiali spesso caoticamente organizzati Perciò materiali Web occorre applicare una fase di scoperta ed analisi in grado di estrarre proprietà e struttura dai documenti, rendendo possibili gli stessi servizi avanzati disponibili su collezioni di documenti meglio strutturati Il Web mining consiste nello svolgere questo compito applicando le tecniche sviluppate nei settori del data mining e dell’estrazione di conoscenze Le informazioni estratte dai documenti Web potranno essere espresse opportune ontologie descritte in notazione XML, in modo da facilitarne l’interscambio, anche le biblioteche digitali Tuttavia, anche se XML e gli schemi XML sono una soluzione adatta per esprimere la struttura ed il significato dei documenti Web, per la natura decentralizzata ed autonoma del Web sarà improbabile che i documenti vengano creati direttamente la struttura adatta Pertanto sarà sempre necessario l’utilizzo di tecniche di Web mining per fornire coerenza a questi materiali Enhanced Content Delivery I passi di scoperta e analisi costituiscono una fase intermedia tra le fonti ed i servizi di accesso forniti agli utenti, come indicato in questa figura: Discovery/ fetching Digital collection Delivery/ query Digital Library/ Websearch Websearch Image search Audiosearch Intranet material Extranet material News search Pricesearch Classification WAPsearch WebMining Inform extraction Raw material Context analysis Indexing Contents Access & DeliveryServices Enhanced Contents Compression Figura Contents delivery I servizi di accesso offerti agli utenti includono i motori di ricerca, i cataloghi tematici, le collezioni a soggetto (audio, video, WAP, ecc.) e i servizi avanzati delle biblioteche digitali In questo progetto ci concentriamo sulle tecnologie necessarie per mettere in funzione questi servizi Le tecnologie di spidering servono ad identificare e prelevare il materiale di interesse Le tecnologie di information extraction e di Web mining vengono applicate per trasformare il materiale originale, estraendo e selezionando le parti rilevanti, generando metadati, sommari e classificando il materiale Infine il materiale arricchito viene reso in una forma che ne agevola l’accesso, ad esempio utilizzando tecniche di indicizzazione e compressione per costruire indici che ne consentano la ricerca o presentandolo opportune interfacce sul Web La pura mole del materiale presente nelle collezioni Web e l’elevato numero di utenti del Web richiede progressi in tecnologie di base, dagli algoritmi alle strutture dati per l’indicizzazione e la ricca su indici compressi, dall’ottimizzazione delle query alla loro distribuzione su server farm Combinare tutte queste tecnologie per costruire la prossima generazione di sistemi di accesso contenuti è un obiettivo ambizioso, ma necessario per mantenere una presenza competitiva dell’industria europea in questo nuovo emergente settore Fondo Speciale Innovazione Obiettivi specifici Il progetto si articola in due azioni, una orientata servizi per le bilbioteche digitali, e una orientata servizi per l’accesso a materiale Web Nella Azione si studiano le questioni legate al trattamento di materiale strutturato e organizzato o da organizzare in una Biblioteca Digitiale In questa azione si affrontano i seguenti problemi:  Sviluppo di un’architettura aperta per Biblioteche Digitali distribuite  Utilizzo di XML per strutturare documenti ed esprimere metadati  Fornire accesso a documenti multimediali nelle Biblioteche Digitali  Formulare e rispondere a interrogazioni su schemi XML  Sviluppo di ontologie per i contenuti delle Biblioteche Digitali  Sviluppare servizi avanzati per gli utenti quali: annotazioni di documenti, notifica, supporto al lavoro di gruppo Nella Azione si affrontano le questioni legate al trattamento di materiale Web, ed in particolare all’indicizzazione ed alla ricerca, all’analisi e alll’estrazione di informazioni che arricchiscono i documenti migliorano la qualità dei servizi In questa azione si affrontano i seguenti problemi:  Sviluppo di algoritmi per indicizzare e ricercare documenti in formato compresso  Sfruttare tecniche di High Performance Computing per fronteggiare le moli dei dati e il numero di utenti dei servizi   Sviluppo di tecniche di Web Mining per determinare:  rank o autorevolezza delle fonti  come migliorare le prestazioni di spidering e caching  come classificare i documenti Sviluppo di servizi di ricerca partecipativa e decentralizzata Le due azioni sono collegate in più punti: ad esempio le tecniche di indicizzazione e ricerca possono essere applicate alle biblioteche digitali, le tecniche di accesso a documenti multimediali possono essere applicate a collezioni di media presenti sul Web, la classificazione di documenti utilizza gerarchie di concetti derivate da ontologie Pertanto si prevede che le due azioni si coordinino e tra loro si sviluppino proficue sinergie Enhanced Content Delivery Azione Biblioteche Digitali XML L’integrazione e l’utilizzo di risorse di calcolo, telecomunicazioni e informazione digitale, in presenza di una costante diminuzione dei costi di digitalizzazione e di una sempre maggiore convergenza/integrazione di tipi di media precedentemente separati hanno creato le condizioni per lo sviluppo di nuove infrastrutture e ambienti in grado di permettere attività, individuali o collettive, basate su informazioni distribuite accessibili in rete Il concetto di “biblioteca digitale” nasce dalla sua analogia la biblioteca tradizionale: uno spazio fisico, o deposito, contenente una collezione organizzata di documenti, insieme a sistemi e servizi atti a facilitare l’accesso fisico ed intellettuale documenti e la loro conservazione Inizialmente l’enfasi è stata data alla conversione retrospettiva dei documenti cartacei in documenti digitali Queste versioni digitali offrono: accesso indipendente da distanza, ricerca full text, metodi più potenti per il recupero tempestivo di informazioni rilevanti Gli investimenti nella conversione retrospettiva dal supporto cartaceo alla forma digitale sono in continua crescita In parallelo, l’emergere delle tecnologie Internet e Web contribuito ad accrescere la consapevolezza che possono essere creati nuovi tipi di documenti che non hanno un equivalente cartaceo ma che esistono soltanto in un mondo digitale Le tecnologie necessarie alla creazione di biblioteche digitali sono molto diverse da quelle relative alle biblioteche tradizionali Infatti, l’informazione digitale si trasferisce una velocità incomparabilmente maggiore, può essere archiviata su scale di densità molto più elevata e può integrarsi in nuovi tipi di documenti che includono testo, immagini, grafica, video, audio, ecc In sostanza, le biblioteche digitali includono le prestazioni offerte dalle biblioteche tradizionali ma vanno ben oltre in termini di funzionalità, portata e significato Possiamo, quindi, definire una Biblioteca Digitale come un ambiente dove si mettono in relazione collezioni, servizi e persone lungo l’intero ciclo di vita della informazione, dalla creazione, disseminazione, utilizzo, fino alla conservazione Le tecnologie delle biblioteche digitali hanno il potenziale di influenzare profondamente alcuni aspetti che riguardano il modo di lavorare l’informazione sotto forma di documento L’impatto dei cambiamenti previsti sarà vasto, ma in alcuni settori sarà anche profondo Un settore particolarmente interessato a questi cambiamenti è quello che riguarda i nuovi modelli della diffusione/disseminazione dell’informazione scientifica Le Bibioteche Digitali, considerando anche il loro contenuto multimediale, costituiscono un importante segmento della gamma di informazioni più organizzate che sono e saranno disponibili su Web In quest’ottica, un ulteriore fattore che sicuramente avrà un impatto crescente sulla tecnologia delle Bibioteche Digitali, sia in termini di documenti gestiti che di metadati descrittivi del loro contenuto, è il crescente affermarsi dello standard XML XML (eXstensible Markup Language), proposto dal World Wide Consortium (W3C), recentemente si è manifestato come nuovo standard per la rappresentazione di dati e lo scambio di documenti sia nella comunità Web che nella comunità sociale XML è un linguaggio per la marcatura di documenti ideato per rendere le informazioni "self-describing" A differenza di HTML, l’attuale standard su Web, XML non si preoccupa dello stile di presentazione del documento (XML Style Sheet), ma della descrizione del contenuto I marcatori usati in XML possono essere decisi dal creatore del documento e quindi possono essere usati per spiegare il significato delle informazioni (es prezzo, quantità, colore e così Fondo Speciale Innovazione via) Questo apre nuove prospettive nell’area di accesso a biblioteche digitali tramite Web, dato che diventerà lo standard di interoperabilità per molte di queste L’obiettivo finale di questo progetto è di sviluppare le tecnologie necessarie per abilitare lo sviluppo di una nuova generazione di Biblioteche Digitali basate su XML Le attività di ricerca porteranno sviluppi nelle seguenti direzioni:  L’utilizzo di XML come strumento per la definizione dei metadati e eventualmente dei documenti digitali, nonché per la specifica delle caratteristiche della biblioteca digitale e della sua interfaccia il mondo esterno, costituiscono un’importante premessa per garantire l’interoperabilità tra le diverse componenti funzionali (i.e., servizi) di un sistema per biblioteche digitali  La definizione di un linguaggio di interrogazione per XML aprirà nuove ed importanti direzioni di ricerca applicata rispetto alle esigenze delle bibioteche digitali Infatti, supponendo che i documenti multimediali siano descritti in XML, sarà possibile accedere a queste sorgenti per mezzo di interrogazioni semanticamente espressive, sfruttando a pieno la struttura del documento  La costruzione di un’ontologia di Biblioteche Digitale, che sia capace di rappresentare una vista virtuale di ogni singola Biblioteca Digitali locale e che definisca le regole di mapping tra le viste delle singole Biblioteche Digitali locali, può essere di grande ausilio agli utenti nel capire il contenuto delle varie Biblioteche Digitali e quindi nel formulare e indirizzare le interrogazioni  La possibilità per diverse classi di utenti di annotare (soprattutto sfruttando la struttura XML del documento) i documenti di una Biblioteca digitale, e la possibilità di generare in modo automatico collegamenti tra documenti e annotazioni, può consentire di ottenere una descrizione sintetica del contenuto semantico del documento e di reperire altri documenti un contenuto pertinente agli interessi dell'utente La generazione automatica di wrapper XML può essere utilizzata per integrare documentazione elettronica disponibile in formati diversi da XML (com’è nella gran parte dei casi attuali di Biblioteche Digitali disponibili) in Biblioteche Digitali basate su XML Enhanced Content Delivery Work Package 1.1 Architettura aperta per Biblioteche Digitali XML 1.1.1 Stato dell’arte Una biblioteca digitale è stata definita come “un’istituzione che realizza e/o supporta, almeno, i servizi di una biblioteca tradizionale nel contesto di collezioni di documenti digitali distribuite e accessibili attraverso la rete - (N Belkin) ” Diverse sperimentazioni sono state portate a termine ed altre sono attualmente in corso per far si che le biblioteche digitali garantiscano un completo servizio di gestione degli oggetti digitali che vada ben oltre la semplice funzionalità di ricerca remota e distribuita Tale servizio, infatti, deve necessariamente includere le funzionalità per l’organizzazione e la preservazione degli oggetti digitali, il controllo del copyright, il controllo delle versioni e l’aggiornamento delle stesse, l’accesso facilitato e personalizzabile alle collezioni di documenti A fronte di questo enorme lavoro per il supporto di funzionalità che permettono una completa gestione delle biblioteche digitali, poco è stato fatto nel campo dell’interoperabilità tra diverse biblioteche, anche se un’importante iniziativa in questo senso (The Open Archives Initiative) è iniziata alla fine del 1999 L’istituto ISTI è stato particolarmente attivo in questi ultimi anni nelle attività di ricerca, sviluppo e gestione dei servizi connessi alle tematiche delle biblioteche digitali In particolare, questa attività portato alla realizzazione della biblioteca digitale di informatica e matematica del consorzio ERCIM (the European Research Consortium for Informatics and Mathematics) Tale biblioteca digitale (denominata ETRDL – Ercim Technical Reference Digital Library) consente la condivisione dei risultati di ricerca fra i ricercatori operanti nelle istituzioni appartenenti al consorzio, ed è una specializzazione di NCSTRL (Networked Computer Science Technical Reference Library) che raccoglie più di 130 enti di ricerca ed università in tutto il mondo 1.1.2 Obiettivi Strategici Un’architettura per biblioteche digitali viene detta aperta quando la funzionalità complessiva viene partizionata in un insieme di servizi autonomi ben definiti ed interoperanti fra loro; servizi che possono essere distribuiti o replicati In questo particolare contesto l’utilizzo di XML come strumento per la definizione dei metadati e eventualmente dei documenti digitali nonché per la specifica delle caratteristiche della biblioteca digitale e della sua interfaccia il mondo esterno, costituiscono un importante premessa che può garantire l’interoperabilità tra le diverse realizzazioni di biblioteche Ciascuno di questi servizi sarà accessibile mediante un protocollo ben definito che definisce l’interfaccia pubblica per quel servizio Il protocollo consisterà di un insieme di richieste di servizio, ognuna delle quali sarà definita in termini del formato della richiesta, del formato della possibile risposta, delle eccezioni e della semantica della richiesta Un servizio sarà istanziato da un modulo software, chiamato server, la cui effettiva implementazione sarà trasparente ed irrilevante per quanto riguarda l’aspetto dell’interoperabilità Per interoperabilità di un servizio s’intende la sua capacità di comunicare attraverso un protocollo predefinito altri servizi Un’architettura aperta così concepita consente un’estensibilità dei servizi forniti dalla biblioteca digitale teoricamente illimitata Il nucleo di servizi che sono necessari per fornire una funzionalità basilare sono: Fondo Speciale Innovazione  Servizio di naming Gli oggetti digitali contenuti in una biblioteca digitale sono identificabili attraverso dei nomi persistenti e unici in tutta la biblioteca Il servizio di naming avrà lo scopo di gestire la creazione, registrazione dei nomi unici e la loro risoluzione negli indirizzi fisici dei server di archiviazione  Servizio di archiviazione Questo servizio fornisce i meccanismi per l’archiviazione e l’accesso degli oggetti, nonché la presentazione della loro struttura  Servizio di indicizzazione Questo servizio consente la ricerca di oggetti digitali (sia testuali sia multimediali) attraverso indici estratti automaticamente dagli oggetti contenuti negli archivi  Interfaccia Utente Questo servizio costituisce il punto di accesso dell’utente alla biblioteca digitale  Servizio di collezione Questo servizio fornisce i meccanismi per aggregare dinamicamente insiemi di oggetti digitali contenuti nella biblioteca digitale in collezioni che sono significative dal punto di vista di una certa comunità Per collezione intendiamo un insieme di oggetti digitali, un insieme di servizi che possono essere utilizzati su tali oggetti e un insieme di politiche di accesso agli stessi 1.1.3 Approccio ed obiettivi specifici L’obiettivo di questo work package è di sviluppare un’architettura aperta per un sistema di biblioteca digitale Tale attività si concentrerà sulla definizione di un sistema di biblioteca digitale sia dal punto di vista funzionale che da quello architetturale, specificando il flusso informativo interno ed i protocolli di comunicazione fra i vari servizi Il sistema verrà realizzato estendendo ed arricchendo l’architettura per biblioteche digitali DIENST Tale sistema verrà in particolare esteso in modo da garantire l’interoperabilità dei servizi di cui è costituito, e verrà modificato in modo da supportare documenti e metadati scritti in XML Gli obiettivi tecnici specifici del lavoro condotto in questo work package saranno quindi: estensione del servizio di archiviazione in modo da supportare oggetti digitali complessi In particolare ogni istanza di un oggetto avrà una struttura logica i cui componenti sono le viste e i segmenti Le viste sono la rappresentazione strutturale del contenuto degli oggetti Ad esempio un oggetto rappresentante un brano musicale può avere come vista lo spartito musicale e la sua riproduzione sonora Le viste costituiscono una rappresentazione alternativa del contenuto e non sono correlate tra loro Ogni vista sarà organizzata in segmenti strutturati gerarchicamente Ad esempio la vista che rappresenta un libro può contenere una struttura gerarchica i cui elementi sono i segmenti “capitolo” costituiti a loro volta dai segmenti “paragrafo” In tale contesto si esplorerà la possibilità di rappresentare tali oggetti digitali utilizzando il linguaggio XML estensione del servizio di indicizzazione: verranno sviluppate e sperimentate nuove strutture efficienti che consentano di effettuare la ricerca per similitudine su oggetti multimediali Queste strutture di accesso saranno usate durante la fase di esecuzione delle interrogazioni, determinando strategie efficienti per l'esecuzione di interrogazioni complesse studio di una interfaccia grafica che sfrutti le potenzialità di XML per offrire interfacce personalizzabili dal punto di vista della lingua parlata dell’utente, del contenuto delle informazioni da disseminare, etc estensione del servizio di collezione in modo da supportare la definizione dinamica di collezione L’obiettivo di questa ricerca sarà in particolare quello di permettere la 10 Fondo Speciale Innovazione Unità Operativa 2.4 Fst s.r.l - Fabbrica Servizi Telematici Responsabile Dott Orlando Murru Presentazione Unità Operativa Descrizione dell’ente: FST è la fabbrica di servizi telematici nata a Cagliari nel 1997 in seno al Gruppo BNL e alla Saras (Gruppo Moratti) come società per l’erogazione di servizi evoluti, che investe in ricerca e mantiene relazioni stabili il mondo scientifico e universitario nazionale e internazionale Le sue attività spaziano dalla progettazione e realizzazione di applicazioni telematiche all’erogazione di servizi in rete per conto di terzi, dalle consulenze tecnologiche nel settore ICT (Information and Communication Technology), alle attività di ricerca industriale sulle tecnologie e i sistemi di costruzione e gestione di servizi in rete Fst maturato rilevanti esperienze nella progettazione, realizzazione e gestione di servizi integrati telematico-finanziari, operando in ambiti diversi quali la progettazione ed erogazione delle applicazioni in rete, lo sviluppo di servizi avanzati di sicurezza, la monetica, la firma elettronica e la certificazione per le applicazioni di commercio elettronico e per i servizi erogati dalla pubblica amministrazione, lo sviluppo di modelli organizzativi e di soluzioni tecnologiche per l'erogazione di servizi telematici su larga scala, lo studio di sistemi per l'accesso unificato all'informazione mediante soluzioni sofisticate di system integration Ricerca, Free Internet, servizi fidelity, e-commerce e, più in generale, outsourcing di servizi telematici, sono gli attuali campi di occupazione di Fst, che trova nell’incontro tra le applicazioni tradizionali e quelle innovative il modo di ottimizzare al massimo le moderne tecnologie e di esplorare nuove aree di business L’innovazione nasce nel centro Ricerca, il cui scopo è analizzare tecnologie esistenti, ottimizzandole e integrandole in settori eterogenei, relativamente a due filoni applicativi principali: analisi, verifica e certificazione delle tecnologie per l’ottimizzazione della rete da una parte, e metodologie per l’ottimizzazione dei sistemi di rilascio, erogazione e gestione di servizi telematici dall'altra Gli ambiti su cui si stanno sviluppando i progetti di ricerca sono basilari per lo sviluppo di servizi telematici innovativi, quali sicurezza nei sistemi informativi, tecnologie di data mining, motori di ricerca di nuova generazione, firma e certificazione digitale, sistemi wireless, studi sulle metodologie per la realizzazione di una moderna fabbrica del software Competenze relative al progetto: L'area di ricerca in cui Fst risulta particolarmente coinvolta è qella dello sviluppo di motori di ricerca di nuova generazione e di metodologie e tecniche di data mining, in quanto maggiormente strategiche per i servizi di data provider e free internet che costituiscono il business delle unità produttive dell'azienda In particolare risultano attinenti le competenze acquisite nel progetto BRAIN (Browsing/Retrieval Advanced Interface), sistema di ricerca che facilita il reperimento di informazioni in rete permettendo all'utente di porre la domanda utilizzando il linguaggio naturale, e MineFaST, che realizza meccanismi di sostituzione della cache di un proxy server metodologie intelligenti di data mining: in entrambi i casi, le informazioni in ingresso sono di natura non omogenea provenienti dal Web, siano essi documenti o file di log Un altro importante apporto costituisce l'esperienza acquisita il progetto Idalog, che utilizzato le metodologie di Data Mining per lo studio di un sistema automatico per la diagnosi e la gestione del rischio nelle reti telematiche 84 Enhanced Content Delivery Partecipazione dell’Unità Operativa Workpackage del Progetto Il contributo dell'UO nell'ambito del progetto proposto si colloca all’interno dei WP2.1 e si occuperà di tutte le problematiche relative al potenziamento degli attuali strumenti di Search Engine strumenti di mining Lo scopo di FST Ricerca, è quello di analizzare tecnologie esistenti, ottimizzandole e integrandole in settori eterogenei, relativamente all’analisi, verifica e certificazione delle tecnologie per l’ottimizzazione della rete, pertanto il suo ruolo all’interno del progetto sarà quello di sperimentare la tecnologia prodotta su case study e data set di interesse dell’azienda allo scopo di valutare il miglioramento sia in termini qualitativi che quantitativi Composizione dell’Unità Operativa e costi del personale Cognome Murru Fenu Sannais Nome Data di Luogo di Qualifica Senior/ Afferenza Mesi/ Costo nascita nascita Junior Persona Personale (MLire) Orlando 06/12/61 Cagliari Dir.Ric S FST 15 FST Rossella 01/04/68 Cagliari Ricercatore S FST 60 Rosalia 07/08/70 Cagliari Ricercatore S FST 60 Tabella di riepilogo dei costi previsti U.O FST Personale Strument Materiali Attrezzat Missioni Totale % MURST 135 0 143 100 Curriculum dei principali ricercatori Orlando Murru Laureato nel 1986 in Matematica presso l'Università di Cagliari una tesi di applicazioni combinatorie, conseguito il Dottorato di Ricerca nel 1991 presso l'MIT di Boston, Massachussetts, una tesi sull'algebra di Baxter e funzioni simmetriche Dal 1991 collaborato i Dipartimenti di Matematica e Ingegneria dell'Università di Cagliari, tenendo anche diversi corsi di Algebra e Geometria; dal febbraio 1994 all'aprile 1998 lavorato presso la Techso S.P.A di Cagliari nel settore della DVD (Digital Video Broadcasting) per lo sviiluppo di software per microprocessore Dall'aprile 1998 lavora in Fst nel settore dello sviluppo dell'infrastruttura a chiave pubblica Murticertify; dal giugno 2000 è il direttore dell'area Ricerca, il ruolo di coordinatore dei vari progetti relativi alla sicurezza nei sistemi informativi (verifica degli accessi, autenticazione utenti, ricerca vulnerabilità delle reti, ecc.), tecnologie di data mining per il recupero di informazioni di difficile estrazione da grandi quantità di dati, motori di ricerca di nuova generazione, firma e certificazione digitale, sistemi wireless, studi sulle metodologie per la realizzazione di una moderna fabbrica del software Rossella Fenu Laureata nel 1995 in Ingegneria Elettrotecnica presso l'Università di Cagliari una tesi di controlli automatici, lavorato in vari ambiti di ricerca, fra cui in particolare lo studio delle tecniche di riconoscimento di segnali nelle telecomunicazioni presso l'Università di Cagliari, i sistemi di controllo nei sistemi produttivi a Grenoble, Francia, presso l'INPG (Institut National Politechnique de Grenoble), e la simulazione di sistemi di controllo presso il Centro di 85 Fondo Speciale Innovazione Ricerche Termiche ENEL di Pisa Dal 1998 è ricercatrice presso la Fst (Fabbrica Servizi Telematici) di Cagliari La sua attuale attività scientifica si svolge nei settori del data mining e web mining Su questi temi partecipato a diversi progetti di ricerca, workshop e conferenze internazionali In particolare, lavorato ad analisi di dati nei domini della grande distribuzione e bancario, alla diagnosi di reti telematiche tecniche di data mining e allo sviluppo di strategie intelligenti di proxy caching l'impiego di tecniche di web mining Lia Sannais Laureata nel 1996 in Ingegneria Elettrica presso l'Università di Cagliari una tesi di elettronica applicata relativa a sistemi di acquisizione dati; collaborato col gruppo di Impianti Elettrici dell'Università di Cagliari allo sviluppo di programmi di ottimizzazione delle reti di media tensione e alla progettazione di dispositivi elettronici di protezione dai disturbi della tensione di alimentazione In questo ambito conseguito il titolo di Dottore di Ricerca in Ingegneria Elettrotecnica presso l'Università di Pisa nel marzo 2000 Dal 1998 è ricercatrice presso Fst (Fabbrica Servizi Telematici) di Cagliari La sua attuale attività scientifica si svolge nei settori del data mining e web mining Su questi temi partecipato a diversi progetti di ricerca, workshop e conferenze internazionali In particolare, l'attività di mining si è concentrata nei domini della grande distribuzione e delle telecomunicazioni, sviluppando sistemi di intrusion detection e strategie intelligenti di proxy caching 86 Enhanced Content Delivery Unità Operativa 2.5 Ideare SpA Responsabile Dr Antonio Gullì Presentazione Unità Operativa Descrizione dell’ente: Ideare è stata fondata nel 1999, come spin-off del progetto europeo Telematics ”EUROSEARCH LE4-8303” Nel progetto i ricercatori di Ideare hanno sviluppato tecniche di classificazione automatica e di sommarizzazione di pagine Web, che costituiscono il nucleo della suite commerciale SearchTone Arianna (the largest Search Engine with Italian content) is uses SearchTone for automatically building its Web Directory, which contains about 25.000 classified sites and more than 80.000 categorized pages SearchTone is also used for suggesting relevant categories related to queries submitted to the traditional search engine Ideare fornisce sia software e assistenza per l’avviamento di servizi Web, sia opera come Application Service Provider, in particolare per servidi di ricerca Ideare si occupa di raccogliere e indicizzazione materiale Web da tutto il continente europeo, e fornisce propri clienti servizi di ricerca: i clienti di Ideare possono aggiungere funzionalità di ricerca propri siti trasmettendo le interrogazioni via rete alla server farm di Ideare e ricevendo le risposte in formato XML, che poi visualizzano propri utenti nel formato preferito all’interno delle pagine del loro sito Competenze relative al progetto: Ideare notevoli competenze nel settore dei motori di ricerca, essendo tra i principali fornitori in Italia e in Europa di tecnologie di ricerca per il Web Tra i clienti di Ideare si contano i principali portali nazionali, tra cui Italia OnLine, Tiscali, Dada, Interfree, Monrif, CiaoWev, Jumpy, Infocamere, RCS - Corriere della Sera Tra i clienti europei si annovera Fireball, il maggiore motore di ricerca in Germania e le consociate Fiscali in tutti i paesei europei Ideare inoltre sviluppato tecniche per l’individuazione di siti e la raccolta di documenti Web, utilizzando reti di workstation e tecniche di load balancing Ideare realizzato inoltre servizi specializzati di ricerca di materiale multimediale (audio MP3, immagini e video) e di documenti WAP Inoltre Ideare creato un servizio di accesso alle Usenet news integrato i servizi di classificazione e ricerca Una delle recenti aggiunte alla linea di prodotti di Ideare è uno strumento per il commercio elettronico: il servizio di confronto prezzi analizza in tempo reale i prezzi di prodotti in diverse categorie e li presenta in un formato omogeneo, la stessa valuta Partecipazione dell’Unità Operativa Workpackage del Progetto Ideare seguirà tutte le attività della azione In particolare metterà a disposizione del progetto i dati contenuti nei propri database, che corrispondono ad oltre un milione di siti in tutta Europa Questi database sono la fonte adatta di informazioni cui applicare le tecniche di Web mining del WP 2.1 Le tecniche del WP 2.2 rivestono vitale importanza per le attività di Ideare, in quanto l’espansione dei propri servizi si deve commisurare la continua crescita del Web e del materiale da raccogliere e indicizzare Ideare intende partecipare allo sviluppo di algoritmi di 87 Fondo Speciale Innovazione estrazione di porzioni di testo da indici compressi, al fine di migliorare la visualizzazione dei risultati delle interrogazioni Ideare intende sperimentare le tecniche di HPC del WP 2.3 per distribuire le operazioni di ricerca sugli indici e di estrazione dei risultati da visualizzare ed è disponibile a mettere a disposizione le proprie server farm per la sperimentazione Infine, la sperimentazione di tecniche di ricerca partecipativa del WP 2.4 apre interessanti prospettive a cui Ideare intende dare il proprio contributo di esperienze e competenze Composizione dell’Unità Operativa e costi del personale Cognome Nome Data di nascita Luogo di nascita Qualifica Gullì Antonio 16/01/71 Taurianova dirigente (coordinatore) (RC) Dato Domenico 23/08/70 Taurianova dirigente (RC) Messineo Francesco Cosenza progettista Senior/ Afferenza Mesi/ Costo Junior Persona Personale (MLire) S Ideare SpA 25 S Ideare SpA 25 J Ideare SpA Totale 24 30 85 135 Tabella di riepilogo dei costi previsti U.O Ideare Personale Strument Materiali Attrezzature Missioni Totale % MURST 135 0 140 100 Personale 98,57142857 Strumentazione 30 Materiali Attrezzature 10,71428571 Missioni 37,5 Totale % MURST 214,2857143 Curriculum dei principali ricercatori Antonio Gullì Antonio Gullì è attualmente amministratore delegato di Ideare SpA Egli ottenuto la laurea in Science dell’Informazione presso l’Università di Pisa nel 1997 Durante il 1996 collaborato la “Scuola Normale Superiore” sviluppando un Web Server daemon che consente connessioni persistenti ad un RDBMS Nel 1996 fatto parte del team di sviluppo di “Arianna” ed contribuito alla realizzazione del primo più grande motore di ricerca per lo spazio Web italiano Egli sviluppato tecniche di gestione di robot per lo spidering distribuito Nel 1997 partecipato all’iniziativa “Java Campus”, di Sun Italia, contributendo diverse applicazioni per connettere database, network monitoring e Web load balancing Nel 1997 partecipato al progetto “Evolving Categorization for Web Search Engines”, finanzziato da HP, sviluppando tecniche di classificazione automatica di testi Nel 1998 lavorato al progetto “Networked Community” ed al progetto europeo ”EUROSEARCH LE4-8303”, sviluppando le tecniche di categorizzazione, che in seguito hanno costitutito il nucleo della suite SearchTone commercializzata da Ideare Nel 1999 fondato Ideare SpA, una ditta che si è specializzata in motori di ricerca, si di testi che di audio/video, classificazione automatica di documenti ed in generale servizi per 88 150 Enhanced Content Delivery portali Web Nel 2000 Ideare è entrata a far parte del gruppo Tiscali ed espanso la sua attività in tutta Europa Gullì è autore di diverse pubblicazioni scientifiche riguardanti le tecnologie dei motori di ricerca Pubblicazioni recenti D Dato, A Gullì, G Attardi, Web Host Enumeration Through DNS, Web Net '97, Toronto, 1997 G Attardi, A Gullì, F Sebastiani, Theseus: Categorization by context, 8th Word Wide Web Conference, Toronto, Canada, 1999 G Attardi, A Gullì, F Sebastiani, Automatic Web Page Categorization by Link and Context Analysis, European Symposium on Telematics, Hypermedia and Artificial Intelligence, Varese, 1999 89 Fondo Speciale Innovazione Tempi e modalità di esecuzione La durata complessiva del progetto è di 30 mesi I mesi finali saranno prevalentemente impiegati  per la disseminazione dei risultati del progetto mediante azioni di promozione presso i principali portatori di interesse (aziende, comunità di utenti, università ed enti di ricerca)  per la valutazione di eventuali follow-up del progetto particolare riferimento alla possibile industrializzazione dei risultati Il progetto è strutturato in due azioni:  azione 1: XML and Digital Libraries  azione 2: Mine the Web: Web search and delivery Milestones:  Mese 0: Meeting di start-up (comune alle due azioni)  Mese 12: Primo workshop edizione degli atti (comune alle due azioni)  Mese 24: Secondo workshop edizione degli atti (comune alle due azioni)  Mese 25-30: Azioni di disseminazione 90 Enhanced Content Delivery Project Management Per un’efficace coordinamento delle attività del progetto e per assicurare il suo regolare svolgimento in linea il piano di lavoro, verrà utilizzata una struttura di gestione del progetto composta da: Direttore del progetto Comitato direttivo Commissione di coordinamento Il Direttore del progetto è nominato dal Consiglio Direttivo del CNR ed è responsabile della gestione del progetto, tiene i rapporti il MURST, segue lo svolgimento del progetto, presiede le riunioni del Comitato direttivo e convoca le riunioni del progetto Egli è responsabile della consegna nei tempi e modi previsti dei risultati del progetto, e si incarica delle attività di disseminazione e contatti l’esterno Il Comitato direttivo è composto dal Direttore del progetto, da un rappresentante del CNR e da un rappresentante del mondo economico Il compito del Comitato direttivo è di assistere il Direttore nei seguenti compiti: verificare il progresso del progetto secondo il piano di lavoro raccomandare opportuni interventi per eliminare eventuali ritardi verificare i costi e la congruità delle spese richiedere di rivedere o modificare: a b c d il piano di lavoro i costi o le tempistiche di singoli task la distribuzione del finanziamento tra i partner la data di terminazione del progetto La Commissione di coordinamento è composta dal Direttore del progetto più un rappresentante per ciascun Work Package La Commissione di coordinamento il compito di: assicurare che ciascun Work Package proceda regolarmente assicurare che ciascun Work Package si coordini e produca i risultati necessari ad altri Work Package informare tempestivamente il Comitato Direttivo di problemi che insorgano nel regolare svolgimento del lavoro Piano di lavoro esecutivo Entro 15 giorni dalla data ufficiale di inizio del progetto, si dovrà tenere una riunione della Commissione di Coordinamento, nella quale verranno presentati ed approvati i piani di lavoro dettagliati per ciascun Work Package, suddivisi per task, indicazione della tempistica, delle risorse necessarie e delle spese previste Di ciascun deliverable dovrà essere indicato il costo complessivo di realizzazione, giustificandone la realizzazione nell’ambito del progetto sulla base di un confronto i costi di acquisizione o di appalto a fornitori esterni Analoga verifica di congruità verrà effettuata almeno semestralmente 91 Fondo Speciale Innovazione Misure di controllo qualità Il progetto stabilirà degli standard di codifica e di testing per il software sviluppato nel progetto In particolare ciascun software package dovrà contenere procedure ben documentate di installazione e di testing Ciascun deliverable dovrà aderire a questi standard e superare i test previsti, prima di poter essere consegnato ed accettato Una fase di beta test dei risultati compessivi del progetto verrà svolta durante gli ultimi mesi del progetto per verificare che soddisfi i requisti di utenti effettivi dei sistemi 92 Enhanced Content Delivery Risorse umane Le tabelle seguenti riassumono l’impegno in risorse umane, espresse in mesi/persona, delle unità operative (UO) nei workpackages (WP) delle due azioni del progetto Tabella Risorse umane – Azione WP/UO Archit Bibl Dig Ling Interrog XML Ontologie XML Annotazioni Estraz Strutt XML Totale ISTI 105 120 Poli.Mi U.Roma U.Mod 108 2 50 119 36 42 57 U.Pad Totale 43 47 117 113 61 51 43 385 Tabella Risorse umane – Azione WP/UO WebMining Indicizzazione e compressione Managing Terabytes Participatory Search Services Totale ISTI Dip.Inf 65 ISI 60 25 55 Ideare 5 20 5 40 20 40 120 125 93 FST 20 Totale 18 168 30 80 45 18 323 Fondo Speciale Innovazione Costo del progetto Tabella Costi Azione U.O Personale Strument Materiali Attrezz Missioni Totale MURST CNR-ISTI-1 585 0 60 645 451,5 Poli-Milano 532 10 76 619 432,9 Univ.Roma3 199 25 15 40 285 200 Univ.Modena 195 30 20 10 60 315 220 Univ.Padova 195 30 10 30 290 203 Totale 1706 85 55 21 266 2154 1507,4 Tabella Costi Azione U.O ISTI-CNR Dip Inf Pisa ISI-CNR Ideare FST Totale Personale Strument Materiali Attrezz Missioni Totale % MURST 682 200 24 37,5 943 660 685 30 19 37,5 771,5 540,05 210 30 38,0 286 200,2 135 0,0 140 98 135 0,0 140 98 1847 260 61 113 2280,5 1596,25 94 Enhanced Content Delivery Risorse del progetto DEI-IMS, Padova Il gruppo di ricerca di Sistemi di gestione delle informazioni (IMS) del Dipartimento di Elettronica e Informatica dell'Università di Padova dispone di un proprio laboratorio di ricerca dotato di alcune stazioni di lavoro Sun, sistema operativo Solaris, X-terminal, e PC sistema operativo Windows/NT; tutti i calcolatori sono connessi alla rete di dipartimento e in Internet Il laboratorio dispone di apparecchiature di supporto al calcolo e alla gestione dei dati e delle informazioni di tipo bibliotecario Dipartimento di Informatica, Pisa Il Dipartimento di Informatica dispone di diversi laboratori di ricerca attrezzati apparecchiature e servizi di rete In particolare il Laboratorio Multimediale dispone di server di alte prestazioni, di 14 postazioni di PC, di notebook, hand held PC, in gran parte forniti da Hewlett-Packard come grant nel quadro dell’inziativa Internet, di cui il Dipartimento è risultato vincitore a livello Europeo, e da Sun Microsystems nell’ambito dell’inziativa Java Campus Altre attrezzature sono disponibili per ciascun docente, ricercatore e dottorando Infine a livello dipartimentale è disponibile una rete di server e un collegamento in una rete a fibra ottica privata dell’Università a livello cittadino e la rete nazionale della ricerca GARR ISTI-CNR Il CNUCE-ISTI e il Dipartimento di Informatica hanno dato vita congiuntamente al Pisa KDD Laboratory (http://www-kdd.cnuce.cnr.it) che dispone nelle due istituzioni di server ad alte prestazioni, postazioni di PC, ed un ricco parco di piattaforme software per database, data warehousing e data mining (IBM Intelligent Miner, ANGOSS Knowledge Studio, SFU DBMiner, Clementine, SAS Miner); la strumentazione hw e sw è in gran parte fornita nell’ambito di progetti di collaborazione Microsoft Research, ANGOSS, DBMiner e IBM L’istituto ISTI del CNR gestisce un laboratorio di ricerca, sviluppo e gestione dei servizi connessi alle tematiche delle biblioteche digitali In particolare tale laboratorio supporta la biblioteca digitale di informatica e matematica del consorzio ERCIM (the European Research Consortium for Informatics and Mathematics) Tale biblioteca digitale (denominata ETRDL – Ercim Technical Reference Digital Library) consente la condivisione dei risultati di ricerca fra i ricercatori operanti nelle istituzioni appartenenti al consorzio, ed è una specializzazione di NCSTRL (Networked Computer Science Technical Reference Library) che raccoglie più di 130 enti di ricerca ed università in tutto il mondo Ideare SpA La società Ideare SpA svolge servizi di indicizzazione e ricerca a livello sia nazionale che internazionale e dispone di gruppi di server per lo spidering del Web in diverse nazioni (Francia, Svizzera, Germania, Belgio, Italia), oltre a cluster di server multiprocessore in ciascuna nazione per lo svolgimento delle interrogazioni vari servizi In ciascuna nazione sono inoltre disponibili dei disk server della Network Appliance da diverse centinaia di Giga Byte, dove vengono conservati gli indici e i documenti raccolti dal Web 95 Fondo Speciale Innovazione Collegamento altri programmi di ricerca I partecipanti al progetto sono coinvolti nei seguenti progetti di ricerca:          MURST ex 40% INTERDATA (Univ Modena e Politecnico di Milano) MURST ex 40% DATAX (Politecnico di Milano) Corporation Integrated Multimedia Intelligent Assistant for Field Operators, Esprit Project 20840 (Univ Modena) W3I3: Intelligent information interfaces for the World-Wide Web, Esprit Project 28771 (Politecnico di Milano) IDEA: Intelligent Datatabase Environments for Advanced Applications, Esprit Project P6333 (Politecnico di Milano) “European CHronicles On-line - ECHO” Partners: CNR, Istituto Trentino di Cultura, Institut National del’Audiovisuel – INA (Fr), Centre National de la Recherche Scientifique – CNRS-LIMSI (Fr), Tecmath GmbH (D), University of Mannheim, Media Site Ltd (UK), Stichting Nederlands Audiovisueel Archief – NAA (NL), Universiteit Twente, Istituto Luce, Carnegie Mellon University (US), Memoriav (CH), Eurospider Information Technology (CH) Durata del progetto: 30 mesi Data di inizio: Marzo 2000 Il progetto è finanziato dal programma Europeo IST Il progetto è coordinato dal CNR-ISTI “A Digital Library Testbed to Support Networked Scholarly Communities – SCHOLNET” Partners: CNR, European Research Consortium for Informatics and Mathematics – ERCIM, Masaryk University (Cz), Foundation for Research and Technology – FORTH-ICS (Gr), GMD-IPSI (D), INRIA (Fr), Swedish Institute of Computer Science – SICS (S) Durata del progetto: 30 mesi Data di inizio: Novembre 2000 Il progetto è finanziato dal programma Europeo IST Il progetto è coordinato dal CNR-ISTI “An Open Collaborative Virtual Archive Environment – CYCLADES” Partners: CNR, European Research Consortium for Informatics and Mathematics – ERCIM), Foundation for Research and Technology – FORTH-ICS (Gr), GMD-FIT (D), University of Dortmund Durata del progetto: 30 mesi Data di inizio: Febbraio 2001 Il progetto è finanziato dal programma Europeo IST Il progetto è coordinato dal CNR-ISTI “Network of Excellence on Digital Libraries – DELOS” Partners: Fanno parte di questa rete di eccellenza 35 enti Europei (Università, Enti di Ricerca, Biblioteche, Archivi, Industrie dell’Editoria Elettronica, Industrie del Broadcasting, Industrie del Software) Durata del progetto: 36 mesi Data di inizio: Gennaio 2000 Il progetto è finanziato dal programma Europeo IST Il progetto è coordinato dal CNR-ISTI 96 Enhanced Content Delivery Ulteriori risorse pubbliche utilizzabili La quota di autofinanziamento è coperta oltre che dagli enti dei consorzi proponenti dai seguenti progetti finanziati: Ente MURST MURST Regione Calabria Microsoft Research Microsoft Research FST Ideare Programma Interesse nazionale 1998 Interesse nazionale 1999 Progetto Agenti Intelligenti: Information Acquisition Algorithms for Large Data Sets: Science and Engineering TelCal Web Computing and Adaptive Agents KDD Lab MineFaST Ricerca e classificazione di documenti Web Partecipante Dipartimento di Informatica, Pisa CNUCE Dipartimento di Informatica, Pisa CNUCE-CNR ISI-CNR Dipartimento di Informatica, Pisa Dipartimento di Informatica, Pisa Dipartimento di Informatica, Pisa CNUCE FST Dipartimento di Informatica, Pisa Il progetto potrà sviluppare utili sinergie i progetti Europei elencati in precedenza (ECHO, SCHOLNET, CYCLADES, DELOS) In particolare, esso potrà utilizzare piattaforme e strumenti software sviluppati nell’ambito di questi progetti Inoltre, lo stabilire di rapporti di collaborazione questi progetti permetterà ricercatori Italiani di scambiare esperienze di lavoro, approcci, tecniche e metodologie i loro colleghi Europei La presenza del CNR in tutti questi progetti nella parte di coordinatore garantisce che verranno stabiliti rapporti di effettiva collaborazione 10 Ricadute tecnico-scientifiche e socio-economiche Gli indirizzi strategici dei governi nazionali e degli organismi sovranazionali, quali l’Unione Europea, fanno costante riferimento allo scenario della Società dell’Informazione, caratterizzata da uno spazio globale delle comunicazioni e dell’economia, favorita dalle tecnologie dell’informazione e della comunicazione e sostanzialmente legata all’avvento di Internet Nella Società dell’Informazione il diritto di cittadinanza per le persone e le organizzazioni è sostanzialmente legato alla possibilità dell’accesso alle informazioni, ovvero alla disponibilità di strumenti che consentano di reperire affidabilità e rapidità le fonti e i servizi di informazione pertinenti alle esigenze e alle attività culturali ed economiche dei cittadini e delle organizzazioni La rilevanza socio-economica di una nuova generazione di strumenti intelligenti per l’accesso al Web appare quindi di vasta portata, specie a fronte del sovraccarico di informazione (information overload) che caratterizza il Web, e che può determinare in prospettiva l’esclusione sociale La competizione globale per conquistare un ruolo preminente nei servizi di accesso al Web è tutt’altro che conclusa, e non è affatto stabilito che l’industria statunitense del software debba 97 Fondo Speciale Innovazione avere anche in questo settore un controllo pressoché completo, come è avvenuto per il settore delle basi di dati La partita si giocherà sulla capacità di recepire le esigenze di accesso e tradurle in termini di servizi intelligenti, e la tradizione della ricerca informatica europea in generale e italiana in particolare è ottimamente attrezzata allo scopo, stante la sua natura interdisciplinare fra le basi di dati, l’intelligenza artificiale e le metodologie innovative di programmazione Dal punto di vista industriale, alcune imprese italiane di piccole o medie dimensioni, fra cui quelle impegnate nel progetto, appaiono in grado di ingegnerizzare le proposte e i prototipi del progetto proposto: gli strumenti intelligenti di accesso sono sistemi knowledge-intensive, che richiedono risorse umane e materiale cospicue per il loro progetto ma non necessariamente per la loro realizzazione Il progetto svilupperà un’architettura per una biblioteca digitale aperta, basata su concetti innovativi, capace di garantire l’interoperabilità fra archivi e collezioni digitali, dove XML costituirà un paradigma di importaza via via crescente L’interoperabilità fra biblioteche digitali è un fattore chiave per proporre le biblioteche digitali come un nuovo modello di comunicazione scientifico-culturale e imporle come una credibile alternativa alle biblioteche tradizionali e alle basi di dati accessibili attraverso il Web Il termine interoperabilità è vasto e abbraccia molti aspetti degli archivi: modelli di metadati, architetture aperte, accesso ad archivi in un contesto interdisciplinare, ecc Il progetto avrà un significativo impatto scientifico su tematiche quali modelli descrittivi di risorse in rete, algoritmi per la ricerca di informazioni distribuite su archivi eterogenei in rete, interoperabilità fra sistemi software, tecniche e strutture di indicizzazione L’interoperabilità fra archivi/biblioteche digitali è inoltre importante perchè offre sostanziali benefici agli utenti supportando efficacemente le attività di “information discovery” e di “delivery” da biblioteche digitali eterogenee e multidisciplinari Inoltre, l’interoperabiltà fra archivi/biblioteche digitali permetterà la creazione di servizi di intermediazione cioè, servizi che integrano ed elaborano informazione proveniente da diversi singoli archivi/biblioteche ed offrono ulteriori funzionalità di supporto agli utenti di biblioteche digitali interoperanti La ricerca scientifico-tecnologica un enorme impatto sulla vita socio-economica di un paese L’innovazione tecnologica è alla base di tutto il progresso (economico, sociale, culturale, ecc.) Essa rende più competitive le industrie, migliora il livello dei servizi, contribuisce alla protezione dell’ambiente, ecc Questo progetto svilupperà un’architettura di biblioteca digitale che permetterà a ricercatori, scienziati, studiosi ecc di avere un largo accesso a grandi collezioni scientifiche e trovare più facilmente ed efficacemente le informazioni cercate Produrrà inoltre significativi cambiamenti nel modo cui gli studiosi comunicano i risultati delle loro ricerche In sostanza, il progetto si prefige di sviluppare una biblioteca digitale quale testbed per migliorare la qualità del lavoro e la produttività dei suoi utenti 98 ... trasformare il materiale originale, estraendo e selezionando le parti rilevanti, generando metadati, sommari e classificando il materiale Infine il materiale arricchito viene reso in una forma che ne... interesse per ciascuna regola; la realizzazione prototipale di un sistema di regole attive per XML sembra pertanto essere di facile realizzazione Un altro settore che beneficierà della presenza... due azioni, una orientata servizi per le bilbioteche digitali, e una orientata servizi per l? ?accesso a materiale Web Nella Azione si studiano le questioni legate al trattamento di materiale strutturato

Ngày đăng: 18/10/2022, 09:11

Tài liệu cùng người dùng

Tài liệu liên quan