-->

إستخدام DNA لتخزين البيانات الرقمية - سعة تخزينية هائلة لكل جرام

إستخدام DNA لتخزين البيانات الرقمية - سعة تخزينية هائلة لكل جرام
    إن المعرفة التي وصلت إليها البشرية لا تقدر بثمن. تخيل لو حدث شيء ما لتلك البيانات وأصبحنا غير قادرين على استخدامها مجدداً!  فهل يجب أن نبدأ من جديد؟
    لحسن الحظ أننا لا نحتاج لذلك لأننا أصبحنا قريبين جداً من امتلاك وسيلة لتخزين كل شيء لمئات الآلاف من السنين.

    ما معنى تخزين البيانات الرقمية باستخدام الحمض النووي؟
    تخزين البيانات الرقمية باستخدام الحمض النووي هو تحويل الكود الثنائي ( The binary code) إلى تسلسل الحمض النووي DNA.

    أي تحويل الطريقة التي يتم بها تخزين البيانات الرقمية وهي لغة الصفر والواحد إلي الطريقة التي يتم بها تخزين المعلومات الوراثية وهي تسلسل القواعد النيتروجينية أو النيكليوتيدات، بهدف الحفاظ على تلك البيانات إلى ألاف السنين-مهما كانت الظروف المحيطة- دون تلف أو ضرر.
    .(Converting the binary code 0s and 1s into DNA sequences Adenine, thymine, guanine, cytosine)


    في الحقيقة يُعتبر كل كائن حي جهاز تخزين عظيم للبيانات البيولوجية، وبسبب القدرة الهائلة التي يمتلكها الحمض النووي DNA علي تخزين البيانات "لقد فكرنا، ما الذى يمنعنا من استخدام الحمض النووي DNA لتخزين البيانات الرقمية؟" قالها نيك جولدمان قائد فريق بحثي في المعهد الأوربي للمعلوماتية الحيوية بالمملكة المتحدة في فبراير عام 2011.



    في الواقع فقد بدأت محاولات استخدام الحمض النووي DNA لتخزين المعلومات الرقمية عام 1988. وإلى الأن لا توجد طريقة واحدة منهم يمكن استخدماها بدلا من الطرق التقليدية الحالية.

    أحد أهم الأسباب هي معدل الأخطاء- الطفرات- التي تحدث باستمرار في الحمض النووي DNA . فمن غير المقبول وجود الأخطاء في تقنية تخزين بيانات حتى لو كانت ستستمر لفترة طويلة. ولكن أظهرت أبحاث في 2016 تقنيات واعدة تمكنت من التغلب على تلك المشكلة.

    أحد الأسباب الأخرى -والتي قد لا تمثل عائق في المستقبل- هي ارتفاع تكلفة بناء التسلسلات المطلوبة لتخزين البيانات (synthetic DNA). ولكن من المبشر أن أسعار تلك التقنيات في انخفاض مستمر.

    يعتبر Microvenus project أولي محاولات استخدام الحمض النووي DNA لتخزين البيانات الرقمية في عام 1988 بواسطة العالم جو ديفيس.
    كان يهدف المشروع إلي تخزين البيانات غير الحية (Abiotic data) باستخدام الأنظمة الحية التي يُقصد بها هنا الحمض النووي DNA. كانت البيانات التي تم تخزينها عبارة عن صورة حجمها 35 بت.

    و كانت المشكلة تكمن في عملية الترميز (encoding process) أي تحويل الكود الثنائي (الصفر والواحد) إلي تسلسلات الحمض النووي - النيكليوتيدات-.
    نتائج عميلة الترميز كانت غير دقيقة بسبب الأخطاءالتي تحدث في الحمض النووي، مما يجعلها غير عملية.
    فحين حاول إدواردو استعادة البيانات التي قام بتخزينها بفك تشفير تسلسل الحمض النووي إلي Morse code ثم إلي اللغة الإنجليزية وجد بعض التغيرات في البيانات التي استعادها عن البيانات التي خزنها.

    رغم افتقار الدقة في كلا المشروعين فقد وضعا أساس تخزين البيانات الرقمية باستخدام الحمض النووي.

     دينا زيلينسكي - يانيف ايرليخ (DNA Fountain method 2016)


    وفي عام 2016 طور باحثان بجامعة كولومبيا  دينا زيلينسكي ويانيف ايرليخ تقنية جديدة لتخزين البيانات الرقمية تسمي (DNA Fountain method) نسبة إلي  الخوارزمية (algorithm) التي استخدموها.
    تلك الخوارزمية مكنتهم من استخدام سعة التخزين الكاملة للنيكليوتيد الواحد في الحمض النووي، والتي تُقدر-نظرياً- بأنها 2 بت لكل نيكليوتيد ( 2bits/nucleotide)

    تقتصر سعة تخزين الحمض النووي من الناحية النظرية على رقمين ثنائيين (2 binary codes digits) لكل نيوكليوتيد ، لكن القيود البيولوجية للحمض النووي نفسه والحاجة إلى تضمين معلومات زائدة عن الحاجة لإعادة تجميع وقراءة الأجزاء في وقت لاحق تقلل من قدرتها إلى 1.8 رقم ثنائي لكل قاعدة نيوكليوتيد.

    كيم مارتينو


     كيف يتم تخزين البيانات الرقمية باستخدام الحمض النووي؟


    تُقسم الطريقة إلي خطوتين رئيسيتين، وهما
    1. تخزين البيانات  الرقمية  بترميزها إلي تسلسل الحمض النووي( encoding digital data into DNA sequence)
    2. استعادة البيانات الرقمية بفك الترميز الحمض النووي (decoding DNA sequence into digital data )

    أولاً عملية تخزين البيانات تتم من خلال


    1. تحديد البيانات المُراد تخزينها.
    2. تقسيم الأكواد الثنائية للبيانات الرقمية إلي أكواد أقصر.
    3. باستخدام خوارزمية DNA Fountain يتم تحويل الأكواد الثنائية إلي تسلسل DNA. بحيث يكون (ادنين 00، سايتوسين 01، جوانين 10، ثيامين 11) - (A is 00, C is 01, G is 10, T is 11)
    4. تقوم الخوارزمية بحذف المناطق أو التسلسلات التي تسبب أخطاء  DNA.
    5. تضيف الخوارزمية علامات إضافية (Tags) لكل تسلسل من DNA  لتساعد في استعادة البيانات بالترتيب الصحيح.
    6.  تحديد التسلسل النهائي الذي سيتم فك تشفيره  مستقبلاً لاستعادة البيانات.


    ثانياً عملية استعادة البيانات


    1. تحديد  تسلسل الحمض النووي (decoding data into DNA sequence) 
    2. تحويل تسلسل الحمض النووي إلي الكود الثنائي (decoding DNA sequence into the binary code)
    3. تحويل الكود الثنائي إلي البيانات الرقمية (decoding the binary code into digital data)



    السعة التخزينية الهائلة!


    الميزة الأهم بالنسبة للحمض النووي بجانب قدرته علي البقاء دون تلف لألاف السنين هي سعته التخزينية الكبيرة.
    فقد تمكن الباحثان دينا زيلينسكي و يانيف ايرليخ باستخدام تقنية DNA Fountain علي تخزين 1.6 - 1.8 بت/نيكليوتيد. هذا يعني أنه يمكن تخزين ما يقارب من 215 بيتابايت ( 215 مليون جيجابايت) في جرام من الحمض النووي.

    تقنية ميكروسوفت وجامعة واشنطن 2016


    تمكن باحثون من جامعة واشنطن وميكروسوف من تخزين 200 ميجابايت باستخدام الحمض النووي. تخزين هذا الكم البيانات بتلك الطريقة هو الأكبر حتي الآن.
    ما يميز تقنية مايكروسوفت ليس حجم البيانات التي خزنتها ولكن القدرة علي استعادة أي جزء محدد من البيانات دون الحاجة إلي فك تشفير البيانات كلها.

    باستخدام تلك التقنية تمكن الباحثون من تخزين 1.10 بت/نيكليوتيد. وطبقا لورقتهم البحثية التي نُشرت في مجلة نيتشر عام 2018 فيمكن تخزين 1 اكسابايت (1 مليار جيجابايت) في كل 1 سم مكعب من الحمض النووي.
    Mohahmmed M7
    @مرسلة بواسطة
    كاتب ومحرر اخبار اعمل في موقع عرب نيوز 24 .

    إرسال تعليق