پایگاه داده Ensembl

پروژه بررسی اطلاعات ژنوم انسان، مهره داران و ارگانیسم های مدل

چندین سال پیش از اتمام پروژه ژنوم انسان، پروژه پایگاه داده Ensembl یا Ensembl genome database project در سال ۱۹۹۹ فعالیت خود را آغاز کرد. در مراحل ابتدایی پروژه، مشخص بود تعداد ۳ میلیارد جفت باز را نمی شود به صورت دستی یادداشت، تفسیر و در اختیار پژوهشگران قرار داد.به همین دلیل هدف از ایجاد پروژه Ensembl این بود که اطلاعات توالی ژنومی و تفسیر آن ها را به همراه سایر اطلاعات زیستی از پیش یافته شده ادغام و تکمیل شود و تمامی این اطلاعات را از طریق وبسایت قابل دسترس برای عموم قرار دهند.

استارت ساخت وبسایت Ensembl از ماه جولای سال ۲۰۰۰ زده شد و تا آن زمان اطلاعات ژنتیکی زیادی به بانک اطلاعاتی Ensembl اضافه شده بود. همینطور اطلاعاتی از قبیل ژن های تطبیقی و تنظیمی که از قبل در دسترس بودند، طی پروژه گسترش یافتند. در واقع پایگاه داده Ensembl به عنوان موتور جستجوی ژنومی برای مهره داران است که از تحقیقات ژنومیکس مقایسه ای، تکامل، تغییر توالی و تنظیم رونویسی پشتیبانی می کند. ابزارهای Ensembl شامل BLAST/BLAT ، BioMart و Variant Effect Predictor(VEP) برای همه گونه های پشتیبانی شده است.

تعداد افرادی که در پروژه پایگاه داده Ensembl شرکت می کردند به طور پیوسته در حال افزایش بود. در حال حاضر گروه Ensembl تشکیل شده از ۴۰ الی ۵۰ نفر که در گروه های مختلف پروژه قرار گرفته اند که تیم های زیر را شکل می دهند

تیم انفورماتیک، آپلود به موقع اطلاعات در سایت را انجام می دهند و بطور مرتب اطلاعات را بررسی می کنند و از واضح بودن مطالب و همینطور کاربر پسند بودن ظاهر سایت اطمینان حاصل می کنند.
تیم های Compara، Variation و Regulation به ترتیب مسئول اطلاعات مقایسه ای، گوناگونی و تنظیمی هستند.
تیم «Gene build» مجموعه های ژنی برای گونه های مختلف ایجاد می کند.‌ این اطلاعات در هسته پایگاه داده ذخیره شده و بوسیله تیم انفورماتیک حفاظت می شود. این تیم همچنین اطلاعات BioMart را توسعه داده و نگهداری می کند
مسئول همگام سازی منظم به روز رسانی اطلاعات Ensembl تیم تولید محتوا می باشد.
تیم Outreach به سوال کاربران پاسخ داده و در زمینه کاربرد های Ensembl کارگاه های جهانی برگزار می کند.

توالی های DNA و … که در ساخت ژن Ensembl مورد استفاده قرار می گیرند، بوسیله پروژه های مختلفی در سراسر دنیا تهیه شده اند. به منظور بهبود سازی ارتباط بین اطلاعات ارائه شده بوسیله سایت های ژنومیک مختلف، وبسایت Ensembl وارد یک توافق نامه با سایت های UCSC و NCBI شده است.

Ensembl علاوه بر وبسایت خود، یک API REST و یک API PERL (رابط برنامه نویسی) را ارائه می دهد که اهداف بیولوژیکی مانند ژن ها و پروتئین ها را مدل می کند و اجازه می دهد اسکریپت های ساده برای بازیابی داده های مورد علاقه نوشته شوند و به صورت مجزا در بخش هایی مانند API اصلی ، Compara API (برای داده های ژنومیک مقایسه ای) ، variation API (برای دسترسی به SNP ها ، SNV ها ، CNV و…) و functional genomics API (برای دسترسی به داده های رگولاتوری) تقسیم شده است. وب سایت Ensembl اطلاعات گسترده ای در مورد نحوه نصب و استفاده از APIها ارائه می دهد.

از این نرم افزار می توان برای دسترسی به پایگاه داده عمومی MySQL استفاده کرد و از نیاز به بارگیری مجموعه داده های عظیم جلوگیری کرد. کاربران حتی می توانند با نمایش داده های مستقیم SQL ، داده ها را از MySQL بازیابی کنند. همچنین مجموعه داده های بزرگ را می توان با استفاده از ابزار استخراج داده Biomart بازیابی کرد که یک رابط وب برای دانلود مجموعه داده ها با استفاده از نمایش داده های پیچیده فراهم می کند.

بیشتر بخوانید:

پایگاه داده GeneCards | پایگاه اطلاعات ژنومی

برچسب ها: پایگاه داده Ensembl