Biotechnologijos institutas yra  mokslinių tyrimų institucija, siekianti užtikrinti valstybės pažangą sparčiai besivystančiose gyvybės mokslų ir biotechnologijų srityse, plėtoti tarptautinio lygio molekulinės biotechnologijos tyrimus, skatinti tarpdisciplininius tyrimus bei mokslo ir verslo bendradarbiavimą

Atvira kristalografinė duomenų bazė COD

Spausdinti

Projektas COD [1] (nuo angl. Crytallography Open Database, http://www.crystallography.net/) siekia surinkti vienoje atviros prieigos duomenų bazėje visas publikuotas organinių, neorganinių ir metaloorganinių molekulių struktūras (išskyrus tik biologinių makromolekulių struktūras, kurias šiuo metu atvirai talpina PDB [2]).

Šią duomenų bazę įkūrė Armelis Lebe (Armel Le Bail), Lachlanas Kransvikas (Lachlan Cranswick), Michaelis Berntas (Michael Berndt), Luka Luterori (Luca Lutterotti) ir Robertas Dounsas (Robert M. Downs) 2003 vasaryje, atsakydami į Michaelio Bernto laišką SDPD elektroninio pašto grupėje (angl. Structure Determination by Powder Diffractometry mailing list) [3]. Nuo 2007 m. pagrindinis duomenų bazės serveris buvo perkeltas į Vilniaus Universiteto Biotechnologijos Institutą, kur jį prižiūri ir programinę įrangą vysto Saulius Gražulis ir Andrius Merkys. Šiuo metu COD duomenų bazė talpina virš 200 tūkst. įrašų, aprašančių struktūras, publikuojamas didžiausiuose recenzuojamuose kristalografijos ir chemijos žurnaluose [4]. Didžioji dalis duomenų apie mineralų struktūras į COD patenka iš AMCSD [5] duomenų bazės, juos COD pateikia AMCSD administratorius ir vienas iš COD įkūrėjų Robertas Dounsas.

Duomenų bazės COD svetainė (Fig. 1a) atvirai prieinama internete ir leidžia ieškoti duomenų pagal pagrindinius kristalografinius ir cheminius parametrus (paieškos svetainę sukūrė Armelis Lebe ir Michaelis Berndtas), peržiūrėti surastas struktūras tiesiog naršyklėje (Fig. 1b) arba nusikelti jas į vietinį kompiuterį tolimesnei analizei. Be to, registruoti naudotojai gali įkelti į duomenų bazę naujas struktūras, tik jau publikuotas mokslo spaudoje, tiek ruošiamas publikacijai ar pateikiamas kaip asmeniniai pranešimai COD. Įkėlimui naudojama programinė įranga, sukurta VU Biotechnologijos institute Sauliaus Gražulio, Justo Butkaus ir Andriaus Merkio. Įkėlimo svetainės programos griažtai patikrina įkeliamų duomenų sintaksę ir semantiką, taip užtikrindamos aukštą į COD patenkančių įrašų kokybę.

a)

b)

Fig. 1 a) COD duomenų bazės žiniatinklio svetainė leidžia ieškoti kristalų struktūrų pagal jų kristalografinius, cheminius ir bibliografinius duomenis b) surastus duomenis galima peržiūrėti tiesiog naršyklės lange arba nusikelti tolimesniam apdorojimui, tiek pavienius įrašus, tiek visą surastą įrašų aibę.

Daug skaičiavimo resursų reikalaujančiai duomenų analizei COD duomenų bazės turinį galima nusikelti pilnai, naudojant Subversijos, Rsync ar HTTP protokolus. Paprastas ir atviras priėjimas prie COD duomenų paskatino įvairius šios duomenų bazės panaudojimus – ji naudojama programinei įrangai testuoti [6], mokymo tikslams [7] bei moksliniams tyrimams [8].

Atviras COD duomenų bazės pobūdis leido sukurti visą eilę COD antrinių serverių („veidrodžių“) skirtingose Žemės rutulio vietose [9-12], bei paruošti specialiems tikslams pritaikytus COD duomenų bazės variantus [7]. Šiuo metu duomenų bazė COD yra pilniausias atviras Žiniatinklio resursas, leidžiantis Lietuvos ir viso pasaulio mokslininkams prieiti prie struktūrinės informacijos apie mažas molekules.

Nuorodos

1. Gražulis, S.; Chateigner, D.; Downs, R. T.; Yokochi, A. F. T.; Quirós, M.; Lutterotti, L.; Manakova, E.; Butkus, J.; Moeck, P. & Le Bail, A. (2009). Crystallography Open Database – an open-access collection of crystal structures, Journal of Applied Crystallography 42 : 726-729.

2. Berman, H.; Henrick, K. & Nakamura, H. (2003). Announcing the worldwide Protein Data Bank, Nat Struct Mol Biol 10 : 980-980.

3. Berndt, M. (2003). Open crystallographic database - a role for whom?, http://tech.groups.yahoo.com/group/sdpd/message/1016 (retrieved 2013.01.31).

4. Gražulis, S.; Daškevič, A.; Merkys, A.; Chateigner, D.; Lutterotti, L.; Quirós, M.; Serebryanaya, N. R.; Moeck, P.; Downs, R. T. & Le Bail, A. (2012). Crystallography Open Database (COD): an open-access collection of crystal structures and platform for world-wide collaboration, Nucleic Acids Research 40 : D420-D427.

5. Rajan, H.; Uchida, H.; Bryan, D.; Swaminathan, R.; Downs, R. & Hall-Wallace, M. (2006). Building the American Mineralogist Crystal Structure Database: A recipe for construction of a small Internet database. In: Sinha, A. (Ed.), Geoinformatics: Data to Knowledge, Geological Society of America.

6. Grosse-Kunstleve, R. & Gildea, R. (2011). Computational Crystallography Initiative: COD stats, http://cci.lbl.gov/cod_stats/ (retrieved 2013.01.31).

7. Moeck, P. (2004). EDU-COD: Educational Subset of COD, http://nanocrystallography.research.pdx.edu/search/edu/ (retrieved 2013.01.31).

8. First, E. L. & Floudas, C. A. (2013). MOFomics: Computational pore characterization of metal–organic frameworks, Microporous and Mesoporous Materials 165 : 32-39.

9. Quirós-Olozábal, M. (2006). COD Mirror of Granada University, http://qiserver.ugr.es/cod/ (retrieved 2013.01.31).

10. Moeck, P. (2007). Crystallography Open Database Mirror, http://nanocrystallography.research.pdx.edu/search/codmirror/ (retrieved 2013.01.31).

11. Gražulis, S. (2007). COD Mirror in Vilnius, http://cod.ibt.lt/ (retrieved 2013.01.31).

12. Chateigner, D. (2010). Crystallography Open Database Mirror at ENSICAEN, http://cod.ensicaen.fr/ (retrieved 2013.01.31).