Professional Documents
Culture Documents
ตรวจเอกลักษณ์ยีนโดยใช้โปรแกรมอาร์ทีมิส
Gene Identification with Artemis
สมชาย แสงอำานาจเดช
21 เมษายน 2553
แบบฝึกหัดที่ 1 การหาบริเวณในยีโนมทีอ
่ าจเป็ นยีน
1. เปิ ดโปรแกรมอาร์ทีมิส
2. เปิ ดไฟล์ TB.fasta ซึ่งเป็ นยีโนมของ Mycobacterium tuberculosis
4. โดยการวิเคราะห์กราฟองค์ประกอบเบส
1. ไปท่เี มนู Graph แล้วเลือก GC frame plot จะได้กราฟ G+C ในแต่ละเฟรมการอ่านรหัส
2. ไปท่เี มนู Graph แล้วเลือก Choosing G+C จะได้กราฟปริมาณ G+C ตลอดยีโนม
3. ปรับขนาดหน้าต่างแสดงกราฟให้เหมาะสม โดยเล่ ือนท่ีแถบสไลด์ด้านข้างของหน้าต่าง
4. เปรียบเทียบกราฟข้อ 1 และ 2 เพ่ ือทำานายบริเวณท่เี ป็ นยีน
5. วิเคราะห์การใช้โคดอน (codon usage) สิง ่ มีชีวิตส่วนมากใช้ชอบใช้โคดอนสำาหรับเก็บ
รหัสโปรตีนท่แ ี ตกต่างกัน ความถ่แี ละจำานวนการใช้คอนดอนถูกรวบรวมในตาราง
(codon usage tables) สามารถนำามาทำานายส่วนของยีโนมท่ีเก็บรหัสได้โดยใช้ codon
usage plot
1. ไปท่เี มนู Graph แล้วเลือก Add usage plots
2. เลือกไฟล์ TB_cu ในโฟลเดอร์ท่ีกำาลังใช้งานอยู่
3. จะได้หน้าต่างกราฟสองหน้าต่าง คือ Forward codon usage plot และ Reverse codon
usage plot
4. ปรับแถบเล่ ือนด้านข้างหน้าต่างเพ่ ือปรับความเหมาะสมของกราฟ
5. ตรวจดูว่า CDSs ใดบ้างท่ีสอดคล้องกับการใช้โคดอนและให้ลบท่เี ห็นว่าไม่สอดคล้อง
อย่างชัดเจนออกไป
6. อาจลองใช้กราฟชนิดอ่ ืนเพ่ ือทำานาย (รายละเอียดสำาหรับกราฟชนิดอ่ ืนอยู่ในคู่มืออาร์ที
มิส)
ควรลบทิ้ง
3. ให้ใช้โปรแกรมในการค้น FASTA สำาหรับ ORF sequences ท่ีหลงเหลืออยู่โดยใช้เมนู Run
แล้วใช้ผลเพ่ ือหาส่วนท่เี ป็ นยีนแท้จริง จากน้ันลบท่ีไม่ใช่ออก (หมายเหตุ CDSs ของ
แบคทีเรียน้อยมากท่ีจะล้ำกันมากกว่า 3-5 โคดอน)
4. ตรวจดูการทำานายท่ไี ด้กับรายการ TB.tab จาก Sanger annotations
แบบฝึกหัดที่ 2 การทำานายยีนของยูคารีโอตส์
2. เพิ่มเอ็กซอนท่ส ี ร้างขึ้นบนโครงสร้างยีน
เลือกบริเวณแบบจำาลองยีนเดิมและส่วนของ CDS feature ใหม่ โดยการกดป่ ุม Shift บน
คีย์บอร์ดค้างไว้แล้วคลิกบน feature ท่ีต้องการ จากน้ันไปท่ร ี ายการ Edit แล้วไปท่ี
Selected Feature(s) แล้วจึงเลือก Merge จะปรากฏกล่องข้อความถามย้ำความม่ันใจให้
ตอบ yes แล้วจะมีอีกกล่องข้อความถามว่าจะให้ลบแบบเดิมหรือไม่ (delete old features)
ถ้าตอบใช่แบบจำาลองยีนเดิมและเอ็กซอนจะรวมกันและลบแบบเดิมออกไป ถ้าตอบไม่
แบบเดิมจะคงอยู่พร้อมกับแบบจำาลองยีนใหม่
3. ตกแต่งเพิ่มเติมตำาแหน่งเริ่มและสิ้นสุด feature ได้โดย ดับเบิ้ลคลิกท่เี อ็กซอนท่ีต้องการ
แก้ไขเพิ่มเติมด้วยตนเอง จะปรากฏแถบแดงบนอีกหน้าต่างหนึ่งให้กดป่ ุมซ้ายของเม้าส์
บนตำาแหน่งเริม ่ ของแถบค้างไว้แล้วลากไปตรงตำาแหน่งเริ่มใหม่ท่ีต้องการจึงปล่อย จะ
พบว่าเอ็กซอนน้ันได้เปล่ียนไปยังตำาแหน่งใหม่ตามต้องการ ในการแก้ไขควรตรวจดู
ข้อมูล splice donor sites และ acceptor sites ด้วย เม่ ือเสร็จแล้วทำาการค้นกับฐานข้อมูลอีก
เพ่ ือดูว่าจะมีเอ็กซอนเพิ่มเติมอีกหรือไม่ ถ้ามีให้ทำาต่อจนได้แบบจำาลองยีนท่ส ี มบูรณ์
จำานวนไม่น้อยท่ย
ี ังไม่ถูกต้องและต้องนำามาแก้ไข การแก้ไขจะใช้ข้อมูลจากการค้นความคล้ายกัน
ของโปรตีนในฐานข้อมูล Uniprot Database
1. เปิ ดโปรแกรมอาร์ทีมิส
2. เปิ ดไฟล์ Pf.fasta ในโมดูล Module_2_Gene_Prediction
3. อ่านไฟล์การทำานายยีนช่ ือ Pf_Phat.tab
4. แสดงกราฟ G+C content
5. อ่านไฟล์ผลจากการค้น Blast ช่ ือ Pf_uniprot.blastx ซึ่งถ้าไม่พบให้เปล่ย ี นชนิดไฟล์จาก
Artemis files เป็ น All Files
6. ให้หาบริเวณท่ีน่าจะเป็ นเอ็กซอนท่ีขาดหายไปจากแบบจำาลองยีน อาจคัดลอกแบบจำาลองยีน
ลงใน tab file อันใหม่ก่อนแก้ไข (โดยใช้รายการ Create แล้วเลือก New Entry จากน้ันคัดลอก
pf_Phat.tab โดยเลือกให้มีเคร่ ืองหมายถูกในกล่องแล้วไปท่ีรายการ Edit เลือก Copy Selected
Features To แล้วเลือก entry ใหม่ท่ส
ี ร้างซึ่งไม่มีช่ือ จากน้ันจึงต้ง
ั ช่ ือ entry น้ีโดยไปท่ร
ี ายการ
Entries แล้วเลือก Set Name Of Entry)
7. เพ่ ือให้ดูง่ายในการเปรียบเทียบให้ไปท่ี Display แล้วเลือก Show One Line Per Entry View จะ
ได้ดังภาพท่ี 2
8. เม่ ือได้บริเวณเอ็กซอนท่ีต้องการรวมเข้าโครงสร้างยีนก็ทำาตามข้ันตอนท่แ ี สดงในแบบฝึ กหัด
ท่ี 2
1. เปิ ดโปรแกรมอาร์ทีมิส
2. เปิ ดไฟล์ Pfal_subseq.embl
3. อ่านไฟล์ Pf_ESTs.tab
4. อ่านไฟล์ EST_blastn.tab ซึ่งเป็ นผลจากค้น BlastN ของลำาดับเบสของ Plasmodium ต่อฐาน
ข้อมูลดีเอ็นเอของ Plasmodium EST sequences ท้ังหมด
5. จากข้อมูลจาก ESTs ให้หาบริเวณเอ็กซอนท่ข ี าดหายไปจากแบบจำาลองยีน
6. เปรียบเทียบแบบจำาลองยีนใหม่ท่ีได้กับผลการศึกษาท่ท ี ำามาก่อนแล้ว (final Sanger
annotation) โดยอ่านไฟล์ Pf_annotation.tab
อ้างอิง
See References in my former documents on using Artemis.