MOKSLASplius.lt

Pasaulyje pripažintos organizacijos „CrossRef“ patirtis – Lietuvos mokslininkams


Geoffrey’į Bilderį kalbina Martin’as Fenner’is

Lietuvos mokslo periodikos asociacija ir Vilniaus Gedimino technikos universitetas (VGTU), išbandę beveik visas CrossRef mokslininkams ir leidėjams šiuo metu si ūlomasinovacijas ir paslaugas, į Lietuvą pakvietė visame akademiniame pasaulyje laukiamą svečią – CrossRef inovacijų direktorių Džefrį Bilderį (nuotraukoje – Geoffrey Bilder). Nuo dešimtojo dešimtmečio pradžios Džefris dirbo prie akademinei bendruomenei skirtų naujausių technologijų kūrimo bei įgyvendinimo. CrossRef Džefris Bilderis atsakingas už naujas idėjas, reikalavimų joms įgyvendinti sąrašų sudarymą, inovacijų kūrimą ir pristatymą rinkai. Ne tik Lietuvoje reikia skirti daug energijos, kad naujovės būtų pripažintos. Taigi, Džefris Bilderis šiais metais atvyksta į Lietuvą skaityti vienos iš savo originalių paskaitų1 apie tai, kaip CrossRef sprendžia viso pasaulio akademinei bendruomenei aktualias problemas.


Turime suvokti, kad visame pasaulyje mokslininkai siekia būti matomi, cituojami ir pripažinti. Vienas kitas mokslininkas tyrinėja tik sau – kiti dirba žmonijos labui, todėl visuomenė ir kolegos mokslininkai apie atliktų tyrimų rezultatus turi sužinoti ir juos įvertinti, skleisti gautą informaciją dar toliau. Užsienyje siekiama, kad mokslininkas būtų žinomas ir teisingai įvertintas. Prasidėjus pasaulinio žiniatinklio erai mokslo informacijos sklaida susiduria su naujomis problemomis, kurioms spręsti ir buvo sukurta pasaulinė ne pelno siekianti organizacija CrossRef.

Pirmoji problema – neveikiančios nuorodos. Pavyzdžiui, nelengvai atradę begalinėse interneto platybėse jums svarbią informaciją, adresą iš viršutinės eilutės dažniausiai tiesiog nukopijuojate į savo failą ir manote, jog šią informaciją pasieksite, kada tik panorėję. Apima nusivylimas, kai po kurio laiko, paspaudę svarbią nuorodą, gaunate pranešimą: Page not found Error 404 (Puslapio rasti nepavyko. Klaida 404). Kartais svarbios informacijos nepadeda rasti ir geriausios paieškos sistemos. CrossRef pasiūlė sprendimą – DOI (skaitmeninis objekto identifikatorius), ir dabar beveik penkiasdešimt milijonų nuorodų į mokslinę informaciją visada veikia stabiliai.

Antroji problema – kas tikrasis publikacijos autorius? CrossCheck – plagijavimo prevencijos programa.

Trečioji problema – kaip atrasti straipsnyje paminėtą publikaciją? Pavyzdžiui, susidomėjote nauju nežinomu autoriumi ir jo atliktais tyrimais. Literatūros sąraše nurodyto straipsnio ieškote paieškos sistemoje, duomenų bazėse, savo institucijos bibliotekos prenumeruojamose duomenų bazėse. Sugaištate nemažai laiko, kol jį randate (jeigu apskritai randate). CrossRef įdiegė sistemą, pagal kurią visi leidėjai privalo įdiegti aktyvias nuorodas į literatūros sąrašus (Reference linking) – Jums belieka paspausti nuorodą. Lietuvoje taip daroma tik VGTU ir Lietuvos fizikų draugijos leidžiamuose žurnaluose.

Kaip minėjau savo ankstesniuose pranešimuose, elektroninė mokslo publikacijų leidyba Lietuvoje tik užgimsta, todėl kai kam šis interviu gali pasirodyti kaip „šumerų raštas“ ar kažkokios „abrakadabros“. Tačiau manau, kad „Mokslo Lietuvos“, kaip ir „Nature“, skaitytojas yra pažangus ir atviras naujovėms mokslininkas, o šis interviu skirtas ir jam – ne tik leidėjui, bibliotekininkui ar duomenų bazių kūrėjui. Pirmiausia, mokslininkų dėmesiui skirtas šiek tiek sutrumpintas Martino Fennerio pokalbis su Geoffrey’iu Bilderiu, vykęs 2009 metais ir išspausdintas „Nature“ žurnale, nė kiek nepasenęs. Reikėtų tik prisiminti įvykusius projektus. Šiame interviu taip pat pristatomas naujausias CrossRef projektas, susijęs su mokslininko kaip autoriaus, recenzento, redaktoriaus, bendraautoriaus ir kito jo vaidmens identifikavimu.

Išsamų interviu vertimą rasite adresu www.moksloperiodika.lt/crossref

Eleonora Dagienė

 

 



Pasaulyje pripažintos organizacijos „CrossRef“ patirtis – Lietuvos mokslininkams

 

 


1. Paaiškinkite, kas yra CrossRef ir kam ši organizacija skirta?


Norėčiau pradėti nuo CrossRef paskirties – nenoriu pačioje pokalbio pradžioje jūsų užmigdyti techninėmis kalbomis.

Mokslinių publikacijų leidėjai sukūrė CrossRef kovai su „nuorodų puvimu“ (angl. link-rot) – žiniatinklio nuorodų struktūros irimu.

Žiniatinklio nuorodų gyvavimo trukmė – maždaug šešeri metai. Tai reiškia, kad po šešerių metų nuoroda greičiausiai nustos veikti, nes turinys, į kurį ji buvo nukreipta, bus perkeltas kitur. Paprastiems vartotojams šis reiškinys tiesiog sukelia nepatogumų, tačiau mokslininkų bendruomenei bei profesionaliems leidėjams ši problema – tikrų tikriausias prakeikimas. Mokslinio įrašo pagrindą sudaro citatos ir nuorodos į jas kituose šaltiniuose. Jei šios nuorodos nustoja veikti, suyra ir visas mokslinis įrašas.

Tačiau ar kova su „nuorodų puvimu“ tokia jau sudėtinga? Juk žiniatinklis šlovinamas būtent dėl decentralizuotos architektūros, kurioje vartotojui priklausantis domeno vardas gali tapti identifikatorių vardų sritimi. Timas Bernersis-Lee yra pasakęs, kad „kieti URI niekada nemiršta“. Tačiau ar universalaus ištekliaus identifikatoriaus (URI) „nemirtingumas“ priklauso tik nuo drausmingumo jį siejant bei sąžiningumo laiku peradresuojant, kai serveryje keičiasi šaltinio buvimo vieta?

Žinoma, didžioji dalis nuorodų nebeveikia dėl tinklalapio administratorių neatsargumo: jie skiria nepakankamai laiko tinkamai tinklavietės URI identifikatorių struktūrai ir peradresavimui. Tačiau nemažai nuorodų nustoja veikti nepriklausomai nuo dedamų pastangų. Taip nutinka todėl, kad kai kuriais atvejais keičiasi nuorodoje pateiktas domeno vardas, o tada pradeda byrėti visas „domeno vardas kaip URI siejimo su šaltiniu vardų sritis“. Kai, atrodytų, visuomet protingai besielgiantys technokratai pradeda kalbėti apie domeno vardų „turėjimą“, man kyla noras persipjauti venas. Domenų vardai mums nepriklauso. Geriausiu atveju galime sakyti, kad juos nuomojamės. Vis dėlto yra begalė būdų netekti galimybės kontroliuoti domeno vardą: dėl teisinio ginčo, užmaršumo, neturto, savanoriško perkėlimo ir pan. Kai nustoji kontroliuoti domeno vardą, nebegali kontroliuoti ir domeno vardu paremtų nuolatinių identifikatorių.

Beje, dar vienas technokratų menas, nenumaldomai man sukeliantis norą susižaloti, yra mintis, kad „šiame paieškos sistemų amžiuje nuolatiniai identifikatoriai nebetenka prasmės. Jei nuoroda nustoja veikti, turinį galime vėl surasti, kad ir kur jis būtų perkeltas.“ Žinoma, šį patogų argumentą dažnai pasitelkia „Google“ ir nuo realybės atitrūkę šios paieškos sistemos garbintojai. Tačiau pakaktų minutei susimąstyti, ir suprastum šio požiūrio ydingumą.


Užtenka paklausti: kaip cituoti konkrečią objekto kopiją, jei skirtingose vietose egzistuoja daugybė beveik identiškų to objekto kopijų? Pavyzdžiui, turime dvi straipsnio kopijas (X ir Y), besiskiriančias viena kita pastraipa, tačiau jos tokios svarbios, kad nuo jų gali priklausyti skaitytojo nuomonė apie visą straipsnį. Taigi, kaip pasaulyje, kuriame pastovias nuorodas palaiko paieškų sistemos, galima būtų sukurti citatos saitą su straipsniu X, bet ne Y? Norint sukurti paieška paremtą nuorodą, kuri, tikėtina, rastų straipsnį X, paieškos URI identifikatoriuje reikėtų koduoti visą straipsnį! Tačiau net tai neužtikrins, kad būsimas skaitytojas bus nukreiptas pirmiausia į X straipsnį. Išlieka tikimybė, kad straipsnis Y bus populiaresnis, nes jį nurodys daugiau žmonių, tad jam bus priskirtas aukštesnis „pagerank“ indeksas (ar kitas reitingas). Kiek pasvarsčius, atsiskleidžia net pačių įvairiausių paieškos sistemų scenarijų (pavyzdžiui, dokumento santraukų, pasitelkus maišos (angl. hash) funkciją, pritaikymas citatoms, atgalinių nuorodų „pingback“ naudojimas ir pan.) bejėgiškumas.


Šias skambiais žodžiais tenorėjau pasakyti, kad nuolatinių identifikatorių žiniatinklyje problema – kur kas sudėtingesnė, nei daugelis galvoja. Taigi, kaip CrossRef ją sprendžia? Manome, kad nuolatinių identifikatorių problema yra labiau socialinio nei techninio pobūdžio. Tiesą sakant, techninė mūsų paslaugos pusė gana nesudėtinga. CrossRef užtikrina tiesioginį ryšį (t. y. rodyklę (angl. pointer)) tarp identifikatoriaus ir URL adreso. Skelbdami ką nors internete leidėjai priskiria tam skaitmeniniam objektui CrossRef identifikatorių (DOI) ir pateikia mums įrašą. Jame pateikiamas CrossRef DOI identifikatorius, pagrindiniai bibliografiniai turinio metaduomenys bei URL adresas, nurodantis turinio buvimo vietą. Leidėjo turinį cituojančius vartotojus skatiname nurodyti ne leidėjo URL adresą, bet CrossRef DOI identifikatorių. Svarbu išsiaiškinti CrossRef organizacinę struktūrą ir jos socialinį poveikį teikiamai paslaugai.


CrossRef buvo įkurta kaip ne pelno siekianti leidėjų narystės organizacija. Pažymėtina, kad mes vartojame labai senamadišką termino „leidėjas“ sąvoką, tad mūsų nariais gali tapti tiek komercinės, tiek ne pelno leidyklos, atvirosios prieigos leidėjai, institucijų saugyklos, NVO ir tarptautinės organizacijos, vaizdo medžiagos bei Wiki programine įranga besinaudojantys leidėjai ir pan. Be to, į savo gretas priimame visų (humanitarinių, socialinių bei tiksliųjų mokslų, profesinių) sričių leidėjus iš viso pasaulio, publikuojančius pačius įvairiausius leidinius (žurnalus, knygas, duomenų bazes, vaizdo medžiagą ir t. t.).


Mūsų narius sieja vienas tikslas – kad jų turinį įvertintų ir juo pasitikėtų profesionalūs tyrėjai. Turinio patikimumą mokslininkai vertina pagal tai, kaip jis pateikiamas moksliniame įraše. Ar teiginiai pagrįsti citatomis? Ar kiti autoriai cituoja šią informaciją?

Prisijungdami prie CrossRef leidėjai sutinka su taisyklėmis ir sąlygomis dėl naudojimosi nuolatine CrossRef nuorodų infrastruktūra. Nariai sutinka:

užregistruoti DOI identifikatorius per vieną savaitę nuo turinio publikavimo internete;

naujinti su DOI identifikatoriumi susijusius URL adresus, jei šie pasikeičia;

turinyje esančias citatas sieti naudodami DOI identifikatorių.

Be to, prisijungdami prie CrossRef nariai taip pat sutinka būti nubausti ar pašalinti, jei nesilaikys tarnybos taisyklių ir sąlygų. Svarbu paminėti, kad pašalinimas – labai griežta bausmė, reiškianti, jog leidėjas taps nematomas, necituojamas. Trumpai tariant, sistemoje yra įdiegta socialinę atsakomybę užtikrinanti drausminamoji priemonė. Kaip jau minėjau, techninė CrossRef infrastruktūra gana paprasta, tad didžiausias CrossRef citatų nuorodų tęstinumo garantas – socialinis aspektas.


2. Kaip, Jūsų manymu, turėtų atrodyti autorių identifikatorius?


Pirmiausia, reikia liautis kalbėti apie autorių identifikatorius. Vienas pagrindinių reikalavimų, kuriuos išsakė mūsų apklausti leidėjai, tyrėjai ir bibliotekininkai – idealiausiu atveju identifikuoti bet ką, kas prisideda prie mokslinės literatūros gausinimo. Tai reiškia, kad norėtume identifikuoti recenzentus, redaktorius, korespondentus, tinklaraštininkus, komentatorius ir t. t. Būtent todėl projektą ir pavadinome CrossRef bendradarbių identifikavimo projektu (angl. CrossRef Contributor ID). Mes ne šiaip sau ieškojome skambaus pavadinimo. Jei, pavyzdžiui, pradedi galvoti apie recenzentų aprūpinimą šioje sistemoje, privalai nepamiršti pseudoanonimiškumo. Vadinasi, reikia sudaryti galimybę priskirti žmonėms recenzavimo nuopelnus, tačiau tą daryti nebūtinai atskleidžiant tai, kas ką recenzavo. Anoniminiams recenzentams nuopelnus už recenzijas priskirianti sistema gali tapti labai naudinga. Galiausiai, jei recenzavimas galėtų būti vertinamas ir reitinguojamas kaip autorystė, tyrėjus galima paskatinti dažniau recenzuoti.

Antra, mano manymu, kalbėdami apie autorių identifikatorius žmonės suplaka daug klausimų į vieną. Ar turime galvoje paprastą simbolį (unikalią eilutę ar skaičių, priskirtą asmeniui panašiai kaip socialinio draudimo numeris), ar tapatumo nustatymo mechanizmą, ar profilio informaciją, susijusią su identifikatoriumi (pvz., publikacijos, narystė, kontaktinė informacija ir pan.)? Žinoma, visi šie klausimai vienaip ar kitaip tarpusavyje susiję. Tačiau juos siejame ir svarbiausią išskiriame remdamiesi savo vartojimo patirtimi.

Trečia, kalbėdamas apie vartojimo patirtį norėčiau paminėti, kad apklausų metu, analizuodami vartotojų reikalavimus identifikavimui, nustatėme dvi plačias panaudos atvejų kategorijas, kurios, nors ir susijusios, turi labai skirtingą reikšmę šios priemonės įgyvendinimui. Vienoje kategorijoje labiau akcentuojamas poreikis „sužinoti“, o kitoje – „nustatyti tapatumą“.

Jei kalbėtume apie „sužinojimo“ panaudos atvejus, akivaizdžiausia bendradarbių identifikavimo nauda žmonėms būtų:

nustatyti, kas parengė, redagavo ar recenzavo X dokumentą;

kokius dokumentus parengė, redagavo ar recenzavo Y asmuo;

kokie identifikatoriai yra susiję su identifikatoriumi Z ir kokio pobūdžio tas ryšys (pvz., bendraautoris, redaktorius, recenzentas);

kokią informaciją apie save (pvz., priklausymas organizacijoms, el. pašto adresas ir pan.) pateikia Z (priklausomai nuo privatumo nustatymų);

visus autorių identifikatorius ir jų publikacijas, jei autorius nurodo priklausymą X organizacijai ir pan.

Privalau paminėti, kad informaciją rinkome siekdami išsiaiškinti mūsų tarnybos narių poreikius, nes didžioji dalis išaiškintų „tapatumo nustatymo“ panaudos atvejų buvo skirta leidėjų naudojamoms sistemoms supaprastinti. Pavyzdžiui, leidėjai bendradarbių identifikatorius norėtų naudoti:

kaip bendrą autentifikavimo vardą rankraščių sekimo sistemoms;

teisingai kontaktinei informacijai, kuria galėtų naudotis leidyklos, autorinio atlyginimo surinkimo ir paskirstymo sistemos, leidimų naudotis kūriniais, kurių autorių teisės saugomos, suteikimo organizacijos ir pan., išsiaiškinimui;

automatiniam el. pašto adresų, naudojamų pranešimams apie atnaujintą turinį, atnaujinimui bei kitai komunikacijai el. paštu;

automatizuotose priemonėse, skirtose išaiškinti galimus recenzentus bei potencialius interesų konfliktus; leidėjo tinklavietėje užregistruotiems vartotojo duomenims sinchronizuoti bei tinkintos ar privilegijuotos prieigos prie turinio suteikimo tyrėjams, remiantis jų profiliuose pateiktais duomenimis;

suprasti visas įmanomas galimybes žmogui prisidėti prie leidėjo veiklos ar srities (pvz., einant redaktoriaus ar konferencijos pirmininko pareigas, vykdant recenzento funkcijas ar parašius laišką ir pan.) ir pan.


Šie panaudos atvejai labiausiai būdingi leidėjams, tačiau tai nereiškia, kad mums nerūpi bibliotekininkų, tyrėjų ir finansuojančių agentūrų panaudos atvejai. Mes aktyviai bendravome su visomis vartotojų grupėmis, bandydami suprasti, kaip galėtume joms padėti. Pavyzdžiui, visai neseniai kalbėjomės su grupe tyrėjų, kurie norėtų naudoti kokį nors autentifikuotą bendradarbių identifikatorių mechanizmą, kuris padėtų kontroliuoti prieigą prie konfidencialių agreguotų genotipų duomenų genomo mastu.


Įdomu pabrėžti, kad tokiems autentifikavimo panaudos atvejams būdingi daug griežtesni reikalavimai nei „sužinojimo“ kategorijai priskiriamiems panaudos atvejams. Kitaip tariant, jei bandomas spręsti tik informacijos gavimo (,,sužinojimo“) klausimas, gali užtekti automatizuotos metodikos, kuri padėtų autoriams atskirti ir suteikti jiems identifikatorius. Pasitelkus pažangiausias automatizuotas autorių atpažinimo (angl. disambiguation) apibrėžtame tekstyne sistemas, tikslius rezultatus galima gauti 96–97 % atvejų, o tai labai neblogai. Taip atrodo iki to momento, kai supranti, kad CrossRef kiekvieną mėnesį gauna apie 200 tūkst. straipsnių identifikatorių, kurių kiekvienas turi vidutiniškai tris autorius. Tai reiškia, kad daugiau nei 20 tūkst. autorių gali būti neteisingai ar visiškai neidentifikuoti. Tokia paklaida gal ir priimtina tais atvejais, kai tiesiog ieškoma informacijos. Tačiau turint tikslą autentifikuoti, tokia situacija tampa nepriimtina.

Kalbant apie autentifikavimą, svarbu paminėti ir ketvirtą aspektą: nors, mano manymu, „OpenID“ standartas taps svarbus visoms teikiamoms paslaugoms, tai gana prastas tapatybės nustatymo metodas, duodantis mažai naudos. Apie šią problemą užsiminiau, kai kalbėjome apie nuolatinius identifikatorius: URI identifikatoriai – nepatvarūs, nes priklauso nuo domeno vardo. O kas nutiks, jei „OpenID“ standartas bus susietas su domenu, kurio nekontroliuojate (pvz., įmonės, įstaigos, šalies)? Ar galėsite garantuoti, kad nusprendę pasitraukti iš įmonės, įstaigos ar išvykti iš šalies, būsite suprasti geranoriškai ir jums bus leista pasilikti ar peradresuoti identifikatorių?

Tikriausiai kiekvienas moksliukas pasakytų: „nesivelkite į tokią situaciją – „OpenID“ identifikatorių susiekite tik su savo domenu, kuris jums priklauso“. Jau kalbėjome, kad domeno vardas jums nepriklauso. Jį nuomojatės. O kas, jei jo neteksite dėl teisinio ginčo, užmaršumo, neturto, skyrybų ar mirsite? Mirsite? Taigi, kad mirsite. O kas nutinka, kai žmogus miršta? Ar kai aš numirsiu, kažkokia dar negimusi mergiotė Georgia Bilder galės įsigyti „mano“ domeną „gbilder.com“ ir juo pagrįsti savo tapatybę? Juk viskas daug sudėtingiau, nei atrodo iš pirmo žvilgsnio.

Tačiau ar šie klausimai netaikytini ir CrossRef? Kas gali garantuoti, kad CrossRef netaps blogio genijumi ir nepasisavins visų mūsų tapatybių? Aišku, tai – „paskirstytas sistemas“ remiančių vartotojų reakcija į „centralizuotas sistemas“. Kaip minėjau „FriendFeed“ diskusijoje, iš viso, kas „paskirstyta“, gimsta tai, kas „centralizuota“. Tad kiekvieną decentralizuotą paslaugą turėjome centralizuoti, kad galėtume ja vėl naudotis („ICANN“, „Google“, „Pirate Bay“, CrossRef, „DOAJ“, „ticTocs“, „WorldCat“ ir pan.). Taigi, grįžtame prie esminio klausimo – kaip sukurti centralizuotą sistemą, kuri taptų atsakinga? Žinoma, tai daugiau socialinis nei techninis klausimas, reikalaujantis tokiai priemonei sukurti aiškias duomenų perkėlimo taisykles bei suteikti jai „valios“ gyvuoti neribotą laiką net ir tuo atveju, jei jos tvarkymą perimtų kita organizacija. Tikrai nemanau, kad geranoriškumo ir šūkio „nebūk blogas“ pakaktų.

Taigi apie tai, kaip „turėtų atrodyti bendradarbių identifikatoriai“, galėčiau kalbėti labai ilgai, tačiau manau, kad jau paminėjau pagrindines šios temos problemas.


3. Kokių pranašumų (ir galbūt trūkumų) reikėtų tikėtis, jei CrossRef tvarkytų autorių identifikatorius?


Manau, kad didžiausias galimas trūkumas būtų tas, kad CrossRef – konsensuso pagrindu valdoma organizacija, kurios nariai kartais yra gana piktai vieni kitų atžvilgiu nusiteikę konkurentai. Šis tarnybos veiklos valdymo aspektas gali veikti kaip stabdis. Kita vertus, tai gali tapti ir stipriąja mūsų puse. Pasiekę susitarimą, galime dirbti greitai ir skatinti leidėjus diegti naujoves.

Moksliniai tyrimai vis dažniau peržengia institucines, geografines ir mokslinių disciplinų ribas, tad dar vienas mūsų pranašumas yra tas, kad teikiame ir panašiai nesuvaržytą paslaugą.

Turime dar vieną labai įdomų pranašumą: mūsų infrastruktūra jau integruota į publikavimo procesą. Mūsų kuriamoje sistemoje yra labai naudinga nuostata: kai tyrėjai, bendraudami su leidėjais, naudojasi CrossRef identifikatoriais, šie duomenys grįžta pas mus, kai leidėjai registruoja DOI identifikatorius. Tai reiškia, kad galima pradėti kurti į autoriaus profilį įdėtų teiginių patikimumo vertinimo sistemą. Pavyzdžiui, autoriaus profilis, sudarytas iš paties autoriaus teiginių (pvz., „aš parašiau straipsnį X“), gal ir nelabai patikimas, tačiau jei jo profilyje nurodomų publikacijų autorystę patvirtina leidėjas (bei yra priskirtas CrossRef bendradarbių identifikatorius), informacija tampa daug svaresnė. Galima įžvelgti labai įdomią teiginių apie parengtas publikacijas hierarchiją:

įgaliotos šalies teiginiai (Leigh’us teigia, kad Geoffrey’is parašė straipsnį X);

paties autoriaus teiginiai (Geoffrey’is teigia, kad Geoffrey’is parašė straipsnį X);

patvirtinti teiginiai (Geoffrey’is teigia, kad Geoffrey’is parašė straipsnį X, o „Psichokeramikos žurnalo“ atstovas tai patvirtina);

patvirtinti įgaliotos šalies teiginiai (Geoffrey’is (kuris, kaip patvirtinta, yra straipsnio X autorius) teigia, kad Kirsty yra straipsnio X bendraautorė).


4. Kaip autorių identifikatorius siejasi su kitais identifikatoriaus, pvz., „ResearcherID“, „Scopus Author ID“ ar „OpenID“?


„OpenID“ sistema – visai kas kita. Kalbėdamas apie kitas sistemas (prie šio sąrašo dar pridurčiau „RePEC“, „SciLink“, „MathPeople“, „Nature Network“ ir pan.) turėčiau paminėti, kad mes jau kalbėjomės su dauguma jų atstovų, norėdami suprasti, kaip šios sistemos galėtų būti susijusios su CrossRef bendradarbių identifikatoriumi „Contributor ID“. Pastebėjome, kad akivaizdžiausiai skiriasi panaudos atvejai. Daugumos sistemų panaudos atvejai galėtų būti priskirti „sužinojimo“ kategorijai. Nė viena jų neapsimeta teikianti kokias nors autentifikavimo paslaugas. Be to, pažymėtina, kad dažniausiai šių sistemų valdytojai autorių identifikavimo funkcionalumą vertina kaip priemonę tikslui pasiekti. Pavyzdžiui, jų pagrindinis tikslas – „pagerinti rezultatus“, „kurti socialinį tinklą“ arba „identifikuoti ekspertus“ samdymui. Tokiais atvejais CrossRef neatrodo esanti konkurentė. Be to, kai kurių sistemų valdytojai net mano, kad mūsų paslauga galėtų būti jiems naudinga gerinant pritaikomumą.


5. Papasakokite apie bendradarbių identifikavimo projekto „ContributorID“ dabartį ir planuojamą veiklą.


Visai neseniai baigėme tyrimų ir reikalavimų aiškinimosi etapą. Darbas nebuvo lengvas, kartais užstrigdavome akligatvyje. Tačiau dabar kuriame prototipą, kurį ketiname išbandyti su keliais leidėjais. Kol kas sunku pasakyti, kiek darbas truks, nes šią veiklą kol kas tik planuojame.


6. Panašu, kad bandymas patenkinti visų interesus – vienas didžiausių iššūkių kuriant identifikatorių. Ko pasimokėte kurdami skaitmeninio objekto identifikatorių (DOI)?


Papasakosiu apie vieną taktinę ir vieną strateginę pamokas.

Taktinę pamoką įsidėmėjau todėl, kad visai neseniai bandžiau kurti priemones, kuriomis būtų galima paskatinti tyrėjus naudoti DOI identifikatorius citatose. Problema kyla tuomet, kai tyrėjas atsitiktinai susiduria su identifikatoriumi, kurį sudaro 80 simbolių. Nėra jokių šansų, kad tyrėjas į savo citatą įterps tokį identifikatorių. Kartais geriau, kai identifikatorius yra ne toks skaidrus, bet trumpas. Manau, kad būsiu nepopuliarus tai sakydamas, tačiau manau, kad Clay’aus Shirky’io mintis apie hierarchines klasifikavimo sistemas taikytina ir identifikatoriams. Jei identifikatoriai bus lengvai interpretuojami, su semantikos prieskoniu, žmonės jaus nenumaldomą norą į identifikatorius įkoduoti (angl. hard-code) ontologijas. Tokie identifikatoriai bus ilgi ir trapūs. Ontologijos neišvengiamai evoliucionuoja, todėl žmonės norės keisti identifikatorius, o tokiu atveju šie arba nustos veikti, arba turėsime sukurti gigantišką identifikatorių atvaizdžio (angl. mapping) posistemį.

Šis sindromas jau pasireiškia naudojant DOI identifikatorius. Kiekvienas skaitmeninio objekto identifikatorius turi prefiksą (angl. prefix) – vardų sritį identifikatorius priskiriančiam leidėjui. Jei pastebėjote, sakau „priskiriančiam“ leidėjui, vadinasi, tai nebūtinai tas leidėjas, kuriam tuo momentu priklauso DOI identifikatorius su minėtuoju prefiksu. Dažniausiai tai reiškia, kad jei leidėjas A įsigis leidėją B, leidėjas A greičiausiai kreipsis į CrossRef, kad mes sukurtume naujus DOI identifikatorius leidėjo B skaitmeniniams dokumentų vaizdams (angl. backfiles), kad visi turėtų tą patį prefiksą! Aišku, tokio prašymo išpildyti negalėtume. Tačiau net nepatikėsite, kokie tokiais atvejais užsispyrę gali būti leidėjai. Jie kažkodėl tapatina tą kvailą prefiksą su prekyženkliu. Žinoma, tai – savotiškas pamišimas, tačiau tokią pamišimo galimybę nesunku numatyti. Prancūzai elgėsi kaip bepročiai, kai regionus įvardijančius automobilių numerius buvo verčiami keisti naujais, beveidžiais, ES reikalavimus atitinkančiais numeriais. Amerikiečiai šėlsta, kai jų gyvenamajai vietai priskiriami nauji telefonų kodai. Trumpai tariant, kai žmonės identifikatoriams priskirs semantinę prasmę, kils bėdų.

Strateginė pamoka tiesiog atspindi jau mano nagrinėtą temą apie techninę ir socialinę problemos puses. Manau, iš pradžių net mūsų tarnybos nariai CrossRef DOI identifikatorius laikė techniniu, o ne socialiniu problemos sprendimo būdu. Bėgant laikui, tapo aišku, kad CrossRef skaitmeninių objektų identifikatoriai tiek pat pastovūs, kiek CrossRef darbuotojai. Norėjau pasakyti, kad kartais turime grasinti baudomis ar dar baisesnėmis sankcijomis už taisyklių ir sąlygų pažeidimą. Tačiau yra ir geroji pusė: CrossRef tapo būtina infrastruktūra dideliam įvairiausių leidėjų ratui, kurie kitomis aplinkybėmis dažniausiai kimba vienas kitam į atlapus. Taigi, šie „skirtingi interesai“ mus visokeriopai sustiprina. Visi nori dirbti geriau, niekas nenori, kad ši tarnyba pražūtų ar būtų pasisavinta. Mes stengiamės įdiegti socialinius saugiklius, kurie užtikrintų tarnybos ilgaamžiškumą. Tam tikra prasme tai reiškia, kad turime būti finansiškai stabilūs (tokie ir esame). Taip pat tai reiškia, kad net mums pradingus kitos interesų grupės galėtų perimti sistemos tvarkymą.


7. Kuo galėtų padėti tyrėjai, besidomintys autorių identifikatoriais?


Pateikti CrossRef daugiau panaudos atvejų.

Išsakyti savo nuomonę CrossRef apie tai, kas, jų manymu, veiks ir kas ne.

Informuoti savo leidėjus, jei mano, kad tai – gera mintis. Žinoma, išsakyti savo nuomonę ir tuo atveju, jei mano, kad mintis – nevykusi.

Originalus tekstas paskelbtas tinklalapyje 2009 m. vasario 17 d. adresu http://blogs.nature.com/mfenner/2009/02/17/interview-with-geoffrey-bilder

 

 


Vertėja Jūratė Griškėnaitė