تحليل بيانات التعبير الجيني باستخدام تقنيات التعلم الآلي
أدى ظهور أنظمة تحليل الجينوم عالية الكفاءة مثل تقنية الرقائق الجينية إلى تسهيل التحول الرئيسي من العلوم المرتكزة على تحليل الجين الواحد إلى علوم تحليل كامل الجينوم. تقنية الرقائق الجينية مكّـنت الباحثين من الحصول على كميات هائلة من البيانات لمستويات التعبير الجيني لآلاف من الجينات تقاس بشكل متزامن. الاستغلال الكامل لبيانات الرقائق الجينية يهدف إلى استكشاف العلاقات المعقدة بين الجينات وغيرها من مكونات الشبكة التنظيمية التي ترتكز عليها جميع العمليات البيولوجية. مع ذلك، بيانات التعبير الجيني تتضمن القليل من المعلومات عن كيفية تنظيم تلك الجينات داخل الشبكة الجينية، وبالتالي تحتاج بدورها إلى تطبيق الطرق المعقدة لتعلم الآلة لتحقيق هذا الغرض. التقدير الكمي للعلاقة التنظيمية بين عوامل النسخ والجينات يعتبر نقطة انطلاق أساسية في جهود نمذجة شبكة التنظيم الجينية. ولأسباب عدة من أهمها صعوبة قياس تراكيز عوامل النسخ بواسطة التقنيات الحالية ولأن عوامل النسخ ذاتها تتعرض لعمليات تنظيمية في مرحلة ما بعد النسخ الجيني، فإن معظم الأبحاث في هذا المجال قد لجأت لاستخدام بيانات مستويات التعبير الجيني للجينات وذلك لاستنتاج العلاقة التنظيمية بين عوامل النسخ والجينات المستهدفة. في هذا العمل، تم تقديم نموذج إحصائي جديد مبني على نموذج انحدار لخليط من توزيعات جاوس وذلك للاستنتاج الكمي للعلاقة التنظيمية بين عامل النسخ وكل جين من الجينات المتأثرة (المستهدفة) بهذا العامل عن طريق استنتاج متغير حساسية كل جين لعامل النسخ، وبالتالي توليد قائمة مرتبة من الجينات المرتبطة بعامل النسخ. قوة نموذج انحدار خليط توزيعات جاوس تكمن في هيكله الذي يجمع بين مزايا النماذج ذات المعالم ومرونة النماذج عديمة المعالم. لقد تم تعليم هذا النموذج باستخدام بيانات السلاسل الزمنية لمستويات التعبير الجيني وقيم تحقق مخبرية تم الحصول عليها باستخدام الحمض الريبي النووي القصير المتداخل. تم تطبيق النموذج المقترح على الشبكة التنظيمية لعامل النسخ (p53) وتم مقارنة النتائج مع الأعمال المماثلة والمبنية على المعادلات التفاضلية. إن النتائج أثبتت أنه بالإمكان تطبيق هذا النموذج على عوامل النسخ الأخرى واستغلال النتائج في بناء أنظمة تشخيص للسرطان ذكية وفاعلة.