تاریخ :۲۰ خرداد ۱۴۰۲
بررسی تنوع ژنتیکی و تجزیه کلاستر (خوشه ای)

بررسی تنوع ژنتیکی و تجزیه کلاستر (خوشه ای)

 • یکی از بهترین راهکارهای طبقه بندی ذخایر توارثی و تجزیه و تحلیل تنوع ژنتیکی بین افراد، استفاده از الگوریتم های آماری چند متغیره است. در تکنیک های تجزیه و تحلیل چند متغیره از تجزیه هم زمان چندین متغیر برای بررسی روابط بین افراد استفاده می شود.

  این تکنیک ها امروزه به طور گسترده برای تجزیه و تحلیل تنوع ژنتیکی داده های مختلف از قبیل داده های مورفولوژیکی، بیوشیمیایی با نشانگرهای مولکولی مورد استفاده قرار می گیرند. از بین این الگوریتم ها، تجزیه خوشه ای و تجزیه به مختصات اصلی (PCoA) جهت گروه بندی نمونه ها به وفور استفاده می شوند.

  بررسی تنوع ژنتیکی و تجزیه کلاستر (خوشه ای)

  روش آماری تجزیه خوشه ای:

  تجزیه خوشه ای یک روش آماری چند متغیره می باشد که هدف اولیه آن گروه بندی افرادی بر اساس میزان تشابه می باشد، به طوری که افراد مشابه از نظر صفات مورد بررسی ما در یک خوشه واحد کنار هم قرار می گیرند. بنابراین در روش تجزیه خوشه ای، افرادی که در یک خوشه قرار دارند، در نمایش هندسی در کنار هم قرار گرفته و افرادی که در خوشه های جدا قرار دارند، از هم دورتر خواهند بود.

  قبل از انجام تجزیه خوشه ای باید ماتریس تشابه براساس میزان تشابه دو به دوی بین ژنوتیپ ها یا نمونه های مورد بررسی تشکیل شود. بنابراین هر چه دو ژنوتیپ از نظر نشانگرهای مختلف الگوی مشابه تری با همدیگر داشته باشند، تشابه ژنتیکی آنها بیشتر خواهد بود و بالعکس. بعد از بدست آوردن تشابه بین افراد تجزیه خوشه ای انجام می شود.

  تجزیه خوشه ای با تشکیل ماتریس داده ها آغاز می شود. بسته به بارز یا هم بارز بودن نشانگرهای مورد استفاده نحوه نمره دهی باندها و ایجاد ماتریس داده ها می تواند متفاوت باشد. برای نشانگرهای بارز مانند RAPD ،AFLP و دارت، معمولا از داده های صفر و یک استفاده می شود. بطوریکه یک بیانگر وجود باند و صفر بیانگر عدم وجود باند (ماتریس صفر و یک) می باشد، در حالیکه نشانگرهای هم بارز مانند SSR به دلیل اینکه عمدتا تنوع درون مکان ژنی را نشان می دهند، بنابراین معمولا به صورت حرفی یا براساس اندازه باندها نمره دهی می شوند.

  روش اتصال میانگین (UPGMA)

  در بین روش های مختلف تجزیه خوشه ای، روش اتصال میانگین (UPGMA) و روش واریانس حداقل وارد بیشترین کاربرد را در بین محققین دارند. البته سایر روش ها مانند نزدیک ترین همسایه و دورترین همسایه نیز توسط برخی از محققین برای تجزیه و تحلیل تنوع ژنتیکی به کار گرفته می شوند. در روش UPGMA پس از تشکیل هسته اولیه هر خوشه بر اساس شباهت بین دو فرد تشکیل می شود، در مرحله بعد شباهت (یا فاصله) هر فرد با افراد درون یک خوشه به صورت میانگین شباهت آن فرد از افراد خوشه در نظر گرفته می شود.

  مرحله اول:

  در این روش ابتدا اولین افرادی که بیشترین تشابه را با همدیگر داشته باشند در یک گروه قرار می گیرند.

  مرحله دوم:

  آنگاه ماتریس تشابه مجددا تشکیل می شود و افرادی که در یک گروه قرار گرفته بودند، به عنوان یک فرد تلقی می شوند، تشابهاتی که شامل افراد این گروه نشوند تغییری نمی کنند. اما تشابهاتی که شامل افراد این گروه شوند به صورت میانگین محاسبه می شوند.

  مرحله سوم:

  مجددا فردی که بیشتر تشابه را با همدیگر داشته باشند در یک گروه قرار گرفته و محاسبه ماتریس شبه جدید انجام می گیرد تا اینکه در آخرین مرحله تنها دو گروه وجود داشته باشند. در این مرحله تجزیه خوشه ای به پایان رسیده و می توان خوشه را بر اساس تشابه های بدست آمده رسم کرد.

  تجزیه خوشه ای

  روش بوت استرپ

  برای بررسی و ارزیابی گروه بندی بدست آمده روش های مختلفی پیشنهاد شده است که معروفترین روش ها در این خصوص روش بوت استرپ است. این روش در سال ۱۹۷۹ به عنوان روش ارزیابی درخت ها در تجزیه های فیلوژنی به وسیله فلسنستین معرفی شد. در حقیقت، بوت استرپ یک آزمون آماری درخت های فیلوژنتیکی با استفاده از چند روش نمونه برداری های متعدد از داده های اولیه است و برای آزمون درخت های ترسیم شده به کار گرفته می شود.

  نتایج حاصل از این آزمون به صورت عددی در کنار گره یک درخت نشان داده می شود که در واقع درصد دفعاتی است که هر شاخه مشخص در نمونه برداری مختلف توسط این آزمون و درخت های حاصل از آن تشکیل می شود. ارزش بوت استرپ را می توان برای هر گره داخلی در درخت اولیه تخصیص داد. این ارزش در واقع بیانگر تعداد دفعاتی است که الگوی شاخه ای دیده شده در آن گره در درختان حاصله تولیده شده است.

  درخت فیلوژنتیکی

  روش تجزیه به مختصات اصلی

  تجزیه به مختصات اصلی همراه با تجزیه خوشه ای، یکی دیگر از تکنیک های چند متغیره است که کاربرد زیادی در تجزیه تنوع ژنتیکی دارد. تجزیه به مختصات اصلی از نظر آماری شبیه به روش تجزیه به مؤلفه های اصلی (RCA) می باشد با این تفاوت که معمولا برای داده ها کیفی از روش تجزیه به مختصات اصلی و برای داده های کمی از روش تجزیه به مؤلفه های اصلی استفاده می شود.

  این تکنیک را می توان برای نمایش دو بعدی یا چند بعدی پراکنش افراد بکار برد. تجمع افراد در یک ناحیه از پلات نشان دهنده تشابه ژنتیکی آن افراد می باشد. در حقیقت از این روش برای کاستن حجم داده ها به منظور روشن ساختن روابط بین دو یا چند متغیر و توجیه تغییرات کل داده های اصلی و اولیه به وسیله تعداد محدودی از متغیرهای جدید مستقل به نام مختصات اصلی می باشد. این نوع دسته بندی اجازه نمایان شدن تفاوت ها را در بین افراد داده و مشاهده همه گروه را ممکن می سازد.

  منبع: کتاب نشانگرهای مولکولی، انتشارات دانشگاه تهران

  امتیاز شما به این مقاله چقدره؟

  میانگین امتیازات ۵ از ۵
  اشتراک‌گذاری

  دیدگاهتان را بنویسید

  نشانی ایمیل شما منتشر نخواهد شد.