Tauhid Nur Azhar

Visi Pak TIK: AlphaFold dan Rekayasa Biotek Untuk Revolusi Peradaban Manusia

Banyak hal dalam hidup ini senantiasa diliputi misteri, dan menguak misteri dalam hidup adalah salah satu hal yang menjadi semangat untuk terus menikmati dan mensyukuri hidup bukan?

Pak T Indra Kesuma adalah guru saya yang amat concern dengan perkembangan teknologi kecerdasan artifisial. Bahkan beliau termasuk salah satu co-founder dari inisiatif Kolaborasi Riset dan Industri Kecerdasan Artifisial atau KORIKA, yang juga terlibat aktif dalam perumusan Strategi Nasional Kecerdasan Artifisial atau Stranas AI.

Salah satu fokus keminatan beliau dalam hal pengembangan AI adalah implementasi pada bidang bioteknologi, healthcare, dan surveilans kesehatan. Terlebih setelah adanya penganugerahan Nobel Kimia pada para perintis inovasi AI dalam perancangan sruktur molekul.

Dimana hadiah Nobel Kimia tahun 2024 dianugerahkan kepada Prof David Baker dan tim pengembang AlphaFold. David Baker adalah seorang ahli perancangan protein secara komputasional. Dimana dengan berdasar pengetahuan struktur asam amino pengonstruksi protein, Baker berkontribusi dalam proses desain obat berteknologi nano, vaksin, dsn juga biosensor.

David Baker lahir pada 1962 di Seattle, Amerika Serikat (AS). Dia meraih gelar doktor pada 1989 dari University of California, Berkeley. Baker juga merupakan seorang guru besar di University of Washington, Seattle, dan peneliti di Howard Hughes Medical Institute, AS.

Sementara separuh dari hadiah Nobel Kimia 2024 dianugerahkan pada suatu inovasi brilian yang menggabungkan kemajuan teknologi kecerdasan artifisial dengan ilmu biologi molekuler dan kimia organik.
Inovasi itu adalah AlphaFold. Apakah itu AlphaFold? AlphaFold adalah suatu model pencarian dan pemetaan struktur protein yang dapat mengidentifikasi dan memprediksi struktur molekul tertentu, termasuk yang belum ditemukan. Saat ini sudah dikembangkan oleh DeepMind, entitas teknologi pengembangnya, dalam 3 versi. AlphaFold1, 2, dan 3.

AlphaFold dikembangkan oleh tim peneliti di DeepMind, sebuah perusahaan kecerdasan buatan yang berbasis di London dan dimiliki oleh Alphabet Inc. Proyek AlphaFold dipimpin oleh sejumlah peneliti handal, seperti John Jumper, yang memimpin tim AlphaFold dan bertanggung jawab atas berbagai aspek dalam pengembangan AlphaFold2. John Jumper memainkan peran penting dalam penerapan metode deep learning untuk prediksi struktur protein.

Lalu ada Richard Evans, leneliti senior di DeepMind yang berfokus pada pengembangan algoritma dan pemodelan struktur protein dalam AlphaFold. Kemudian ada Andrew Sr, peneliti di bidang pembelajaran mesin yang terlibat dalam pengembangan metode deep learning untuk memperbaiki akurasi prediksi struktur protein. Juga ada Pushmeet Kohli, kepala departemen sains di DeepMind yang memimpin tim ilmiah dan memainkan peran strategis dalam berbagai proyek sains, termasuk AlphaFold.

Serta last but not least, ada Demis Hassabis, CEO dan salah satu pendiri DeepMind, yang mendukung inisiatif penelitian jangka panjang dan memberikan arahan strategis dalam pengembangan teknologi AlphaFold._l

Pengembangan AlphaFold juga melibatkan kolaborasi antar peneliti dari berbagai disiplin ilmu, termasuk bioinformatika, biologi komputasi, dan kecerdasan buatan. Mereka bersama-sama mengembangkan sistem berbasis deep learning yang mengandalkan arsitektur transformer untuk memecahkan masalah pelipatan protein yang telah menjadi tantangan besar dalam biologi selama beberapa dekade.

Jika kita ingin melihat dan mempelajari perkembangan saat ini, ada baiknya kita pelajari evolusi AlphaFold mulai dari versi 1. Dimana AlphaFold 1 merupakan model awal yang dikembangkan oleh DeepMind untuk memecahkan masalah prediksi struktur protein. AlphaFold 1 mengikuti kompetisi Critical Assessment of Techniques for Protein Structure Prediction (CASP13) pada tahun 2018 dan meraih skor tertinggi di antara metode lainnya.

Model ini menggunakan teknik Machine Learning yang didasarkan pada Convolutional Neural Networks (CNN) untuk memprediksi jarak antar-asam amino dalam rantai protein serta sudut di antara residu-residu tersebut. AlphaFold 1 menciptakan peta jarak (distance map) yang menunjukkan jarak spasial antara setiap pasangan residu. Meskipun inovatif, pendekatan AlphaFold 1 masih memiliki keterbatasan dalam hal akurasi dan efisiensi untuk memprediksi struktur yang sangat kompleks.

Versi berikutnya yang lebih up date secara teknologi dan kapasitas prosesing adalah AlphaFold2. Di mana AlphaFold 2 merupakan pengembangan signifikan dari versi pertama, yang dirilis pada tahun 2020. Model ini menggunakan arsitektur yang berbeda, yaitu Transformer Neural Networks yang mampu menangkap hubungan kompleks antar-residu dalam protein. Pada CASP14, AlphaFold 2 menunjukkan performa luar biasa dengan akurasi yang mendekati metode eksperimental, seperti kristalografi sinar-X.

AlphaFold 2 menggunakan metode Multiple Sequence Alignment (MSA) dan konsep ko-evolusi untuk menemukan pola dalam urutan asam amino yang memberikan wawasan tentang interaksi residu dalam struktur tiga dimensi. Keunggulan utama AlphaFold 2 adalah kemampuannya untuk memprediksi struktur protein dengan presisi tinggi dalam waktu yang jauh lebih singkat, membuatnya menjadi alat yang sangat berharga dalam biologi molekuler, bioteknologi, dan riset biomedis.

Selain itu, AlphaFold 2 juga tetap menggunakan distance map untuk menggambarkan kedekatan spasial antar-residu, yang membantu dalam rekonstruksi struktur protein.

AlphaFold2 menerima masukan urutan asam amino dengan struktur yang belum diketahui. Model ini kemudian mencari di database yang berisi urutan dan struktur protein yang mirip. Tahap ini menggunakan data dari berbagai spesies untuk membantu mengidentifikasi pola evolusioner pada protein.

Model AI menyelaraskan urutan asam amino dari spesies yang berbeda untuk melihat bagian mana yang dipertahankan selama evolusi. AlphaFold2 menganalisis bagaimana asam amino berinteraksi dalam struktur tiga dimensi, menggunakan prinsip ko-evolusi, di mana asam amino yang berinteraksi dalam struktur protein cenderung berevolusi bersama. Hasil dari tahap ini adalah peta jarak yang memperkirakan seberapa dekat asam amino satu dengan lainnya dalam struktur.

Proses analisis iteratif dilakukan oleh neural network (jaringan syaraf tiruan) dengan transformer, untuk mengidentifikasi elemen-elemen penting dalam struktur. Data tambahan dari struktur protein lain juga digunakan, jika tersedia dari tahap pertama.

AlphaFold2 menyusun potongan-potongan struktur berdasarkan urutan asam amino yang ada dan menguji jalur yang memungkinkan untuk membentuk struktur protein hipotetis. Proses ini diulang melalui siklus iteratif hingga beberapa kali sampai model mencapai struktur final. Model AI kemudian menghitung probabilitas kesesuaian struktur yang dihasilkan dengan struktur yang sebenarnya.

Meskipun masih dalam fase pengembangan dan belum dirilis, versi AlphaFold 3 diharapkan dapat menyempurnakan pendekatan dan metode yang ada di AlphaFold 2 dengan peningkatan pada beberapa aspek seperti prediksi interaksi antar protein. Di mana AlphaFold 3 dapat dikembangkan untuk memprediksi kompleks multi-protein dan bagaimana protein-protein ini berinteraksi dalam sel. Hal ini penting untuk memahami jaringan protein dan interaksi dalam sistem biologis yang lebih kompleks.

Protein juga bukan satu-satunya biomolekul yang memiliki struktur tiga dimensi. Molekul RNA dan kompleks RNA-protein juga memiliki struktur yang berfungsi dalam banyak proses biologis. AlphaFold 3 mungkin mampu memperluas prediksi ini pada molekul non-protein, yang sangat bermanfaat untuk riset biologi dan pengembangan terapi RNA.

AlphaFold 3 juga diperkirakan dapat mengintegrasikan prediksi struktur dengan simulasi dinamika molekular (molecular dynamics) untuk memahami perubahan bentuk protein dalam berbagai kondisi lingkungan.

Dengan algoritma yang lebih efisien, AlphaFold 3 diharapkan dapat memprediksi struktur protein dalam waktu yang lebih singkat tanpa mengorbankan akurasi, memungkinkan aplikasi dalam skala industri.

Pengembangan AlphaFold 3 akan sangat pesat jika menggunakan teknologi Graph Neural Networks (GNN) untuk menganalisis kompleks multi protein, mengingat kemampuan GNN dalam menangkap hubungan antar entitas dalam struktur kompleks. Selain itu, teori dinamika molekular dapat diintegrasikan untuk memberikan wawasan tentang konformasi protein dalam kondisi fisiologis yang berbeda, memperkaya informasi yang tersedia tentang stabilitas dan fleksibilitas struktur.

Kehadiran AlphaFold telah membawa dampak signifikan dalam berbagai bidang ilmu pengetahuan dan memiliki potensi besar untuk pengembangan masa depan. Berikut adalah beberapa manfaat yang dihasilkan oleh AlphaFold dan prospek pengembangannya di berbagai bidang seperti teknik biomedis, riset biologi fundamental, konservasi lingkungan, pengelolaan penyakit genetik, imunologi dan vaksin, pengembangan obat dan model terapi presisi, psikogenomik, sampai nutrigenomik.

AlphaFold dapat membantu dalam proses desain obat dengan memprediksi struktur protein yang menjadi target terapi, seperti protein dari virus atau bakteri patogen. Dengan memprediksi struktur ini, para peneliti dapat merancang molekul yang secara spesifik dapat mengikat dan menginhibisi protein tersebut, sehingga mempercepat pengembangan obat baru.

Banyak penyakit genetik disebabkan oleh mutasi yang mempengaruhi struktur protein. AlphaFold memungkinkan para ilmuwan untuk mempelajari efek mutasi pada struktur protein secara lebih cepat, membantu mereka memahami patogenesis penyakit dengan lebih baik.

AlphaFold memungkinkan para ilmuwan untuk merancang dan merekayasa protein enzim yang lebih efisien untuk aplikasi industri, seperti produksi bahan kimia, bahan bakar bio, dan makanan.

Fungsi utama AlphaFold berikutnya, adalah membantu pengembangan protein rekayasa yang bisa digunakan sebagai agen terapi, seperti antibodi yang dioptimalkan untuk mengikat antigen spesifik, atau protein yang dapat membantu proses penyembuhan jaringan.

Dengan memahami struktur protein dari berbagai spesies, AlphaFold juga dapat membantu mengungkap jalur evolusi protein dan bagaimana fungsinya berkembang. Ini sangat penting untuk memahami sejarah biologi kehidupan di bumi.

AlphaFold dapat mengambil peran dalami studi biologi fundamental karena dapat memprediksi struktur protein dan menguraikan fungsi dasar dari protein yang belum diketahui fungsinya. Hal ini dapat memberikan wawasan tentang berbagai konsep dan mekanisme biologi molekuler yang mendasar.

AlphaFold bisa digunakan untuk memprediksi protein spesies yang langka atau terancam punah tanpa perlu mengambil sampel fisik, membantu dalam pemahaman ekosistem dan interaksi biologisnya.

AlphaFold dapat digunakan dalam studi mikrobioma, baik di lingkungan manusia maupun di alam, untuk memahami peran protein tertentu dalam keseimbangan ekosistem. Ini bisa membantu dalam konservasi spesies dan ekosistem yang lebih luas.

AlphaFold dapat membantu dalam mendesain protein yang mirip dengan antigen dari patogen seperti virus dan bakteri, yang dapat memicu respon imun yang lebih baik. Hal ini penting dalam pengembangan vaksin untuk berbagai penyakit infeksi.

AlphaFold juga dapat membantu memahami struktur protein yang terlibat dalam respons imun, seperti reseptor sel-T dan sel-B, dapat memberikan wawasan tentang cara tubuh merespon infeksi atau bahkan membantu dalam imunoterapi untuk kanker.

Di masa depan, AlphaFold mungkin akan diintegrasikan dengan teknologi AI lainnya untuk menganalisis data biologi yang lebih kompleks, seperti data genomik, transcriptomics, dan metabolomics, menciptakan pendekatan yang lebih komprehensif dalam biologi sistem.

AlphaFold saat ini memprediksi struktur individu protein, tetapi pengembangan selanjutnya mungkin akan memungkinkan prediksi interaksi antar protein atau bahkan kompleks multi protein. Ini penting untuk memahami bagaimana protein bekerja bersama dalam sel dan jaringan.

AlphaFold dapat dikombinasikan dengan simulasi komputer untuk menguji stabilitas dan fungsi protein secara virtual, menciptakan laboratorium berbasis komputer yang dapat menghemat biaya eksperimen laboratorium fisik.

Di masa depan, AlphaFold dapat ditingkatkan untuk memprediksi perubahan struktur protein dalam berbagai kondisi lingkungan, seperti perubahan pH, suhu, atau keberadaan molekul pengikat. Ini akan berguna dalam memahami bagaimana protein beradaptasi dengan lingkungan tertentu, penting dalam penelitian bioteknologi dan farmasi.

Selain protein, RNA dan molekul non-protein lainnya juga memiliki struktur yang penting untuk fungsinya. Pengembangan AlphaFold yang mampu memprediksi pelipatan RNA dan struktur molekul lain akan memperluas aplikasi dalam riset biologi dan bioteknologi.

Lalu bagaimana kita di Indonesia dapat mengoptimasi pemanfaatan AlphaFold? Antara lain adalah dengan menginisiasi riset kedokteran dan terapi presisi dengan mengembangkan molekul terapeutik dari bahan alam Indonesia dengan bantuan AlphaFold. Sebagaimana kita ketahui perkembangan riset bioinformatika di Indonesia juga telah maju dengan sedemikian pesatnya. Berbagai penapisan maya dari struktur molekul tanaman obat telah banyak dilakukan. Demikian pula proses identifikasi metabolit dan senyawa atau zat aktif dari bahan alam telah banyak dilakukan di beberapa pusat riset yang berafiliasi dengan perguruan tinggi ataupun lembaga negara seperti BRIN atau Kementerian terkait.

Data struktur kimia tanaman obat dapat diperoleh dari beberapa basis data, di antaranya, basis data struktur tiga dimensi senyawa kimia dari tanaman obat di Indonesia yang dibuat berdasarkan Materia Medika Indonesia yang terdiri dari 222 spesies dan 1481 senyawa. Ada pula basis data fitofarmaka yang disediakan oleh Fakultas Farmasi dan Ilmu Komputer di Universitas Indonesia. Basis data ini menganotasi senyawa bahan alam asli Indonesia.

Selain itu kita pun telah mengembangkan basis data jami, dimana basis data ini dikembangkan oleh IPB dan Nara Institute of Science and Technology (NAIST).

Selain itu, tentu saja ada basis data sumber rujuka global; PubChem yang berkedudukan di Amerika Serikat, dimana basis data ini berisi struktur kimia lead compound yang telah dikurasi dan dikumpulkan dari berbagai sumber kredibel serta tervalidasi secara saintifik.

Tak hanya basis data berupa struktur molekul ataupun kimia dari tanaman berpotensi obat saja, Indonesia bahkan telah memiliki pustaka mikrobiota yang disimpan dalam sistem BioMCC (Biotechnology Microbial Culture Collection) yang dulu berada dan dikelola oleh Balai Bioteknologi BPPT dan kini beralih ke BRIN.

Basis data tersebut adalah asset yang sangat penting untuk pengembangan berbagai terapi berbasis farmakomolekuler. Meski harus diakui, dengan penerapan AlphaFold yang optimal, berbagai jenis molekul sintetis dapat dirancang dan diproduksi untuk mendukung terapi presisi yang lebih handal.

Di masa depan tak dapat dipungkiri bahwa teknologi rekayasa dalam ranah bioteknologi yang ditunjang sepenuhnya oleh pemanfaatan kecerdasan artifisial seperti AlphaFold memang akan menjadi bagian dari revolusi Sapien yang takkan terbendung lagi.

Jadi boleh disimpulkan bahwa keminatan luar biasa Pak Indra Kesuma pada model AlphaFold ini amatlah beralasan. Mungkin karena Pak Indra adalah seorang yang jeli dan visioner dalam memetakan dinamika peradaban di masa depan. Wajar jika saya berguru kepada beliau bukan?

🙏🏾🙏🏾🇲🇨

Bahan Bacaan Lanjut tentang AlphaFold dan teknologi terkait

1. AlQuraishi, M. (2019). End-to-end differentiable learning of protein structure. Cell Systems, 8(4), 292-301. https://doi.org/10.1016/j.cels.2019.03.006

2. Baek, M., DiMaio, F., Anishchenko, I., Dauparas, J., Ovchinnikov, S., Lee, G. R., … & Baker, D. (2021). Accurate prediction of protein structures and interactions using a three-track neural network. Science, 373(6557), 871-876. https://doi.org/10.1126/science.abj8754

3. Bepler, T., & Berger, B. (2021). Learning the protein language: Evolution, structure, and function. Cell Systems, 12(6), 654-669. https://doi.org/10.1016/j.cels.2021.05.017

4. Berman, H. M., Battistuz, T., Bhat, T. N., Bluhm, W. F., Bourne, P. E., Burkhardt, K., … & Zardecki, C. (2002). The Protein Data Bank. Acta Crystallographica Section D: Biological Crystallography, 58(6), 899-907. https://doi.org/10.1107/S0907444902003451

5. Bhattacharya, D., & Cheng, J. (2017). DeNovo structure prediction using deep learning. Computational and Structural Biotechnology Journal, 15, 379-382. https://doi.org/10.1016/j.csbj.2017.03.006

6. Callaway, E. (2020). “It will change everything”: DeepMind’s AI makes gigantic leap in solving protein structures. Nature, 588(7837), 203-204. https://doi.org/10.1038/d41586-020-03348-4

7. Dill, K. A., & MacCallum, J. L. (2012). The protein-folding problem, 50 years on. Science, 338(6110), 1042-1046. https://doi.org/10.1126/science.1219021

8. Evans, R., & Jumper, J. (2020). AlphaFold’s success at CASP13. Proteins: Structure, Function, and Bioinformatics, 88(9), 1222-1227. https://doi.org/10.1002/prot.25909

9. Jumper, J., Evans, R., Pritzel, A., Green, T., Figurnov, M., Tunyasuvunakool, K., … & Hassabis, D. (2021). Highly accurate protein structure prediction with AlphaFold. Nature, 596(7873), 583-589. https://doi.org/10.1038/s41586-021-03819-2

10. Kryshtafovych, A., Schwede, T., Topf, M., Fidelis, K., & Moult, J. (2021). Critical assessment of methods of protein structure prediction (CASP)—Round XIII. Proteins: Structure, Function, and Bioinformatics, 89(12), 1687-1699. https://doi.org/10.1002/prot.26160

11. Marks, D. S., Colwell, L. J., Sheridan, R., Hopf, T. A., Pagnani, A., Zecchina, R., & Sander, C. (2011). Protein 3D structure computed from evolutionary sequence variation. PLoS One, 6(12), e28766. https://doi.org/10.1371/journal.pone.0028766

12. Mills, C. L., Garg, R., & Zhuang, W. (2020). Machine learning for structural bioinformatics. Bioinformatics, 36(11), 3450-3462. https://doi.org/10.1093/bioinformatics/btaa235

13. Moult, J., Pedersen, J. T., Judson, R., & Fidelis, K. (1995). A large-scale experiment to assess protein structure prediction methods. Proteins: Structure, Function, and Genetics, 23(3), ii-v. https://doi.org/10.1002/prot.340230303

14. Ovchinnikov, S., Park, H., Kim, D. E., DiMaio, F., & Baker, D. (2018). Protein structure prediction using Rosetta in CASP12. Proteins: Structure, Function, and Bioinformatics, 86, 113-121. https://doi.org/10.1002/prot.25390

15. Pereira, J., Simpkin, A. J., Hartmann, M. D., Rigden, D. J., Keegan, R. M., & Lupas, A. N. (2021). High-accuracy protein structure prediction in CASP14. Proteins: Structure, Function, and Bioinformatics, 89(12), 1681-1686. https://doi.org/10.1002/prot.26171

16. Raifeld, M., & AlQuraishi, M. (2021). Machine learning in protein structure prediction. Annual Review of Biophysics, 50, 121-140. https://doi.org/10.1146/annurev-biophys-061220-094522

17. Rives, A., Meier, J., Sercu, T., Goyal, S., Lin, Z., Liu, J. Z., … & Kohli, P. (2021). Biological structure and function emerge from scaling unsupervised learning to 250 million protein sequences. Proceedings of the National Academy of Sciences, 118(15), e2016239118. https://doi.org/10.1073/pnas.2016239118

18. Röthlisberger, D., Khersonsky, O., Wollacott, A. M., Jiang, L., DeChancie, J., Betker, J., … & Baker, D. (2008). Kemp elimination catalysts by computational enzyme design. Nature, 453(7192), 190-195. https://doi.org/10.1038/nature06879

19. Seemayer, S., Gruber, M., & Söding, J. (2014). CCMpred—Fast and precise prediction of protein residue–residue contacts from correlated mutations. Bioinformatics, 30(21), 3128-3130. https://doi.org/10.1093/bioinformatics/btu500

20. Senior, A. W., Evans, R., Jumper, J., Kirkpatrick, J., Sifre, L., Green, T., … & Hassabis, D. (2020). Improved protein structure prediction using potentials from deep learning. Nature, 577(7792), 706-710. https://doi.org/10.1038/s41586-019-1923-7

21. Sercu, T., & Goel, S. (2016). Convolutional networks for protein-protein interaction site prediction. Bioinformatics, 32(18), i425-i434. https://doi.org/10.1093/bioinformatics/btw473

22. Skolnick, J., & Gao, M. (2019). Interplay of physics and evolution in the likely origin of protein biochemical function. Proceedings of the National Academy of Sciences, 116(35), 17591-17600. https://doi.org/10.1073/pnas.1907771116

23. Tunyasuvunakool, K., Adler, J., Wu, Z., Green, T., Zielinski, M., Žídek, A., … & Jumper, J. (2021). Highly accurate protein structure prediction for the human proteome. Nature, 596(7873), 590-596. https://doi.org/10.1038/s41586-021-03828-1

24. Wang, S., Sun, S., Li, Z., Zhang, R., & Xu, J. (2017). Accurate de novo prediction of protein contact map by ultra-deep learning model. PLoS Computational Biology, 13(1), e1005324. https://doi.org/10.1371/journal.pcbi.1005324

25. Xu, J. (2019). Distance-based protein folding powered by deep learning. Proceedings of the National Academy of Sciences, 116(35), 16856-16865. https://doi.org/10.1073/pnas.1821300116

Kamu suka? Yuk bagikan tulisan ini.

Similar Posts