"딥마인드 '알파폴드' 넘어섰다"...단백질 구조 11억개 예측한 ESM폴드2 작성일 05-28 26 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">마크 저커버그 아내가 설립한 CZ바이오허브</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="VPLkbSEoLN"> <figure class="figure_frm origin_fig" contents-hash="201254568e4056c333aec811cafa855aaea551b816261b10bcff1c8f9acf0cc2" dmcf-pid="fQoEKvDgLa" dmcf-ptype="figure"> <p class="link_figure"><img alt="단백질 구조를 3D 일러스트레이션으로 나타낸 이미지. 게티이미지뱅크 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/28/dongascience/20260528154517356bvsp.jpg" data-org-width="680" dmcf-mid="2PG3c20HLj" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/28/dongascience/20260528154517356bvsp.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 단백질 구조를 3D 일러스트레이션으로 나타낸 이미지. 게티이미지뱅크 제공 </figcaption> </figure> <p contents-hash="3f0f882c5db4a17f3080806478f29dd37a3e011004c353bc1c46b93c04f90892" dmcf-pid="4xgD9TwaRg" dmcf-ptype="general">구글 딥마인드가 개발해 2024년 노벨 화학상까지 안긴 단백질 구조 예측 인공지능(AI) 모델 '알파폴드'의 성능을 뛰어넘는 모델이 개발됐다는 주장이 제기됐다. 단백질 구조 예측 연구 분야의 중요한 자원이 될 것이란 평가와 성능에 대한 의구심이 엇갈린다. </p> <p contents-hash="f5cd1f346df0e77799f39cfcb852c54ef6a41164de94d4b912d22a4cd0e59451" dmcf-pid="8LDhQ5lweo" dmcf-ptype="general">27일(현지시간) 국제학술지 ‘네이처’ 보도에 따르면 미국 생의학연구기관 ‘챈 저커버그 바이오허브(CZ 바이오허브)' 연구팀이 이날 ‘ESM폴드2’라는 단백질 구조 예측 AI 모델의 결과를 모아놓은 데이터베이스 ‘ESM 아틀라스’를 공개했다. CZ 바이오허브는 메타(구 페이스북) 창업자인 마크 저커버그 아내이자 의사인 프리실라 챈이 설립한 연구소다.</p> <p contents-hash="8d20b198713a7c40ae2cb6eb644ebc74c07e94f6f15aaafbfd24ee569fd97bb4" dmcf-pid="6owlx1SrJL" dmcf-ptype="general">CZ 바이오허브에 따르면 ESM폴드2는 구글 딥마인드의 최신 단백질 구조 예측 모델인 ‘알파폴드3’을 비롯한 다른 모델보다 예측 성능이 뛰어나다. 보도에 따르면 ESM폴드2가 예측한 단백질 구조 데이터 수는 알파폴드 예측 데이터가 담긴 ‘알파폴드 데이터베이스’보다 8억개 많다. </p> <p contents-hash="df35bc5f29e4987a4d98461bed9357c40609f96777308955488e971a57038d71" dmcf-pid="PgrSMtvmMn" dmcf-ptype="general">ESM 아틀라스 연구를 이끈 알렉스 리브스 CZ 바이오허브 과학책임자는 “ESM 아틀라스는 가장 미지의 단백질 영역들까지 보여준다”며 “새로운 생물학적 발견을 위한 강력한 기반이 될 것”이라고 설명했다. </p> <p contents-hash="fe25bd93db7d6a7ee20b5889a0450b6f592acce2db39d168762d347eb1845ada" dmcf-pid="QamvRFTsii" dmcf-ptype="general">ESM폴드2는 연구팀이 2024년 공개한 ‘단백질 언어 모델’을 기반으로 한다. 단백질 언어 모델은 단백질의 아미노산 서열을 언어처럼 학습하는 모델이다.</p> <p contents-hash="5760d3ff2c8bef4934493cdb2426907a8a48053f62ed24f0218dc802af145430" dmcf-pid="xNsTe3yOLJ" dmcf-ptype="general">연구팀은 생명체에서 얻은 수십억 개의 단백질 데이터를 모델에 학습시켰다. 토양, 바다 등 다양한 환경에 존재하는 미생물들의 유전체 총합을 의미하는 ‘메타유전체’도 포함된다. 메타유전체 데이터는 알파폴드 데이터베이스에는 존재하지 않는 데이터다. </p> <p contents-hash="3f6077d845e70269a1034c490aef05573f3690f21de6181d1e459a84b260e8fa" dmcf-pid="y09QGax2Rd" dmcf-ptype="general">연구팀에 따르면 ESM폴드2는 기존 모델들보다 항체 분자가 표적 항원에 결합하는 구조 등 단백질 복합체 구조를 더욱 정확하게 예측한다. ESM폴드2는 암과 면역질환에 관여하는 단백질에 강하게 결합하는 새로운 항체와 단백질도 설계했다. 연구팀은 ESM폴드2가 설계한 항체와 단백질을 실험실에서 제작해 설계 예측대로 작동한다는 점을 확인했다. </p> <p contents-hash="9de58ff9720ea5fa06d9b3463d792acb81711c6a39aaee553824bae293314b36" dmcf-pid="Wp2xHNMVee" dmcf-ptype="general">연구팀은 ESM폴드2를 이용해 11억개의 예측 단백질 구조, 68억개의 단백질 서열 정보를 담은 아틀라스를 구축했다. 리브스 소장은 “ESM 아틀라스를 무료로 공개했다”며 “‘연구자들이 단백질 세계의 ’알려진 영역‘과 ’미지의 영역‘을 연결하는 데 도움이 될 것”이라고 밝혔다.</p> <p contents-hash="5b412258717ff306fb653dd9663de4e4e96732389db9581e518a988547b19995" dmcf-pid="YUVMXjRfMR" dmcf-ptype="general">연구팀은 ESM 아틀라스를 이용해 서로 다른 생물에서 나온 단백질의 구조적 친연성을 실제로 밝힌 바 있다. 바이러스 공격을 방어하기 위한 미생물 방어 시스템인 ’크리스퍼 미생물 방어 단백질‘과 토양 곰팡이에서 발견된 '유전자 교정 단백질'의 구조적 유사성을 발견한 것이다.</p> <p contents-hash="132a66a041af75e73e77931bff6efa875ede93de69436ed19260da2dacc40d64" dmcf-pid="GufRZAe4RM" dmcf-ptype="general">크리스퍼 미생물 방어 단백질은 지금까지 세균과 같은 원핵생물에서만 발견되는 것으로 여겨졌는데 곰팡이와 같은 진핵생물에서 유사한 단백질이 존재한다는 사실을 찾아냈다. </p> <p contents-hash="5848119f8e7acecf734a27643e802695fb6ddba62e2773c5772685a9da750b98" dmcf-pid="H74e5cd8ex" dmcf-ptype="general"> 과학자들은 ESM폴드2가 모든 것을 투명하게 공개하는 오픈소스라는 점을 높게 평가하고 있다. 제마 앳킨스 스웨덴 룬드대 계산생물학과 교수는 “ESM폴드2의 데이터베이스는 생물학 분야의 엄청난 자원이 될 것”이라며 “대규모 단백질 언어 모델은 단백질의 근본적인 생물학적 규칙들을 포착할 수 있다”고 말했다. </p> <p contents-hash="97ef4e5b3ad1b3655ea242d16cdad777f0996e656e9a791e0215ba5092bb250b" dmcf-pid="Xz8d1kJ6MQ" dmcf-ptype="general">크리스틴 오렝고 영국 유니버시티칼리지런던 구조·분자생물학과 교수도 “ESM폴드2의 예측은 새로운 단백질 접힘 구조와 기능을 발견하는 데 도움을 줄 수 있다”며 “단백질 설계와 생물학 기초 이해 과정에 중요한 영향을 미칠 것”이라고 설명했다. </p> <p contents-hash="75769cc8b132ba76188344185910cf711e25a6b4ce50ad76b7637812ce69b48e" dmcf-pid="Zq6JtEiPeP" dmcf-ptype="general">ESM폴드2의 성능에 의구심을 제기하는 과학자도 있다. 마틴 슈타이네거 서울대 생명과학부 교수는 “ESM폴드2가 기존에 알려진 단백질과 매우 다른 단백질 구조를 얼마나 잘 예측할 수 있을지 의문”이라며 “ESM폴드 초기 버전은 메타유전체 데이터에서 독특한 단백질 구조를 예측하는 데 그다지 뛰어나지 않았다”고 말했다. </p> <p contents-hash="d8d9b4ba2aec1bb760c08bcdf68308a3a8102b4b64ce978aafb6670c4987d967" dmcf-pid="5BPiFDnQL6" dmcf-ptype="general">세르게이 오브치니코프 미국 매사추세츠공대(MIT) 생물학과 교수는 ESM폴드2가 알파폴드 데이터베이스의 대체재라기보다 보완 자원이라고 평가했다.</p> <p contents-hash="426555bb359a98c888ca9cf6bad97925e3f41ee1de528dd5444c9381914ac941" dmcf-pid="1bQn3wLxL8" dmcf-ptype="general">[문세영 기자 moon09@donga.com]</p> </section> </div> <p class="" data-translation="true">Copyright © 동아사이언스. 무단전재 및 재배포 금지.</p> 관련자료 이전 LGU+, 5G·LTE 요금제 벽 허문다…통신요금 ‘심플’ 승부수 05-28 다음 "칩플레이션에 팔수록 손해" 올해 스마트폰 시장 역대 최강 한파 온다 05-28 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.