You are on page 1of 21

Trình tự bộ gen tiết lộ các tuyến phân tán toàn cầu và gợi ý sự

thích nghi di truyền hội tụ trong quá trình tiến hóa của cá ngựa
Cá ngựa có sự phân bố vòng quanh toàn cầu ở vùng nước ven biển nhiệt đới đến
ôn đới. Tuy nhiên, cá ngựa thể hiện nhiều khả năng thích nghi với lối sống ít vận
động, khó hiểu: chúng yêu cầu môi trường sống cụ thể, chẳng hạn như cỏ biển,
tảo bẹ hoặc rạn san hô, thiếu vây bụng và vây đuôi, đồng thời sinh ra những con
non phát triển trực tiếp mà không có giai đoạn ấu trùng nổi rõ rệt, tạo ra khả
năng di chuyển tầm xa. phân tán bằng các phương pháp thông thường không
hiệu quả. Ở đây, chúng tôi điều tra các mô hình địa sinh học và phân tán trên
toàn thế giới của cá ngựa dựa trên tập hợp bộ gen de novo của Hippocampus
erectus cũng như 358 bộ gen được sắp xếp lại từ 21 loài. Cá ngựa tiến hóa vào
cuối Thế Oligocene và các tuyến đường xâm chiếm toàn cầu tiếp theo được xác
định và liên kết với sự thay đổi động lực của các dòng hải lưu và các khe hở
đường biển theo thời gian cổ. Hơn nữa, cơ sở di truyền của kiểu hình thích nghi
“gai xương” định kỳ có liên quan đến những thay thế độc lập trong một gen phát
triển quan trọng. Do đó, các phân tích cho thấy rằng việc đi bè theo dòng hải lưu
sẽ bù đắp cho sự phân tán kém và khả năng thích ứng nhanh chóng tạo điều kiện
thuận lợi cho việc xâm chiếm môi trường sống mới. Việc giải thích các cơ chế
đa dạng hóa sinh học biển là một thách thức do thiếu thông tin liên tục về các
mô hình hình thành loài và địa lý học trong các hệ sinh thái biển. Các sự kiện
gián tiếp địa chất lớn, chẳng hạn như việc đóng cửa đường biển Panama hoặc
đường biển Tethys, đã được cho là có tác động đến các mô hình đa dạng sinh
học biển, đặc biệt đối với các sinh vật có chiến lược phân tán dựa vào dòng hải
lưu vận chuyển ấu trùng cá nổi hoặc đi bè trên các vùng biển rộng lớn. khoảng
cách. Trong các dòng dõi như vậy, sự phân kỳ về hình thái sinh thái và sự thích
nghi cục bộ sau một sự kiện thuộc địa có thể diễn ra chậm ngay cả khi có áp lực
chọn lọc phân kỳ mạnh mẽ. Do đó, cần có các nghiên cứu toàn diện đề cập đến
các mô hình đa dạng hóa không gian-thời gian bao gồm động lực học của các
quá trình địa vật lý, cũng như kiến thức về cơ sở di truyền và cơ chế phát triển
của các đặc điểm thích nghi chính, để hiểu được các cơ chế này.

thúc đẩy sự phát triển của đa dạng sinh học


biển.
Bức xạ của cá ngựa (Họ Syngnathidae) là một hệ thống mô hình đặc biệt mang
tính biểu tượng và phù hợp để nghiên cứu các tác động mà hoạt động kiến tạo và
động lực dòng hải lưu có thể gây ra đối với sự phân tán và đa dạng hóa của các
loài phân loại biển do sự phân tán của cá ngựa bằng cách đi bè. để nghiên cứu sự
tiến hóa nhanh chóng của các kiểu hình thích nghi trong môi trường mới. Bộ gen
của cá ngựa tiến hóa theo một số tỷ lệ đột biến cao nhất trong số các loài teleost
và có tỷ lệ đa dạng hóa lớn nhất trong họ của chúng (Hình bổ sung 1, Figshare:
Bộ dữ liệu 1-hình phía dưới). Tất cả các loài cá ngựa đều ít vận động nhưng biểu
hiện các đặc điểm hình thái và lịch sử cuộc sống chuyên biệt, chẳng hạn như
đuôi có khả năng cầm nắm (và không có vây đuôi), mõm thon dài, không có vây
bụng, lớp giáp bằng các tấm xương thay vì vảy, và một bộ phận độc nhất vô nhị.
phương thức mang thai của con đực, theo đó con đực sinh ra những con non
phát triển. Các loài cá ngựa khác nhau rất nhiều về kích thước cơ thể, kiểu màu
sắc và các đặc điểm thích nghi khác với môi trường tương ứng của chúng, chẳng

Cá ngựa

hạn như sự hiện diện hay vắng mặt của các gai xương, có khả năng là sự thích
nghi để chống lại kẻ săn mồi.

Nghiên cứu trước đây tiết lộ rằng nguồn gốc tiến hóa của cá ngựa có thể nằm ở
Ấn Độ-Thái Bình Dương vào cuối thế Oligocene, nơi các dòng dõi khác nhau
phân tán trên toàn cầu mặc dù khả năng bơi lội kém bền của cá ngựa và việc
chúng dựa vào việc đi bè là chiến lược phân tán đường dài chính. sự hiểu biết
toàn diện về các tuyến đường xâm chiếm của cá ngựa vẫn còn thiếu vì sự tái tạo
phát sinh gen thường chỉ bắt nguồn từ tương đối ít loài và/hoặc ít dấu hiệu di
truyền
Ở đây, chúng tôi nghiên cứu các mô hình đa dạng hóa của những loài cá độc đáo
này dựa trên việc phân tích nhiều bộ gen cá ngựa được giải trình tự. Bằng cách
tiến hành các phân tích phát sinh loài toàn diện, chúng tôi suy ra lịch sử nhân
khẩu học của chúng và làm rõ vai trò của việc đóng cửa đường biển trong quá
trình đa dạng hóa của chúng như là một phần của việc truy tìm các tuyến đường
thuộc địa từ nguồn gốc tổ tiên chung đến sự phân bố hiện tại của chúng. Ngoài
ra, chúng tôi đề cập đến sự tiến hóa kiểu hình thích nghi của cá ngựa bằng cách
nghiên cứu sự phát triển của một trong những đặc điểm bắt mắt nhất trong chi:
sự hiện diện hay vắng mặt của các gai xương.

kết quả và thảo luận


Sự đa dạng toàn cầu của cá ngựa. Sử dụng trình tự đọc dài PacBio (độ bao
phủ ~ 115 lần), trình tự đọc ngắn Illumina (độ bao phủ ~ 243 lần) và công nghệ
Hi-C (độ bao phủ ~ 184 lần), chúng tôi đã tập hợp bộ gen của một con đực
Hippocampus erectus . Với contig N50 là 15,5 Mb, tổ hợp cấp độ nhiễm sắc thể
của chúng tôi (tổng kích thước 420,66 Mb; bao gồm 22 siêu giàn giáo tương ứng
với số lượng nhiễm sắc thể dự kiến) (Hình bổ sung 2–4, Bảng bổ sung 1–4 và
Dữ liệu bổ sung 1) được cải thiện về tính liền kề trình tự so với các tổ hợp có
sẵn trước đó được tạo ra chỉ từ các lần đọc ngắn của Illumina (contig N50: 14,57
kb)
Chúng tôi đã sắp xếp lại trình tự bộ gen (độ bao phủ ~ 16 lần) của 358 mẫu ngựa
biển bao gồm 21 loài phản ánh sự phân bố toàn cầu của Hippocampus, với đại
diện của các dòng cá ngựa chính (Hình 1a, Hình bổ sung 5a, Dữ liệu bổ sung 2) .
Phân tích của chúng tôi đã xác định từng loài cá ngựa là một nhóm đơn ngành
trong cây ghép hàng xóm được suy ra từ 41 triệu đa hình nucleotide đơn trên
toàn bộ gen (SNP) (Hình 1b, Bảng bổ trợ 5–8) và chúng tạo thành các cụm riêng
biệt trong thành phần chính phân tích (Hình bổ sung 5b). Sự đa dạng di truyền
(θπ và θω) thay đổi đáng kể giữa các loài và nhiễm sắc thể, ví dụ như ở cá ngựa
ở quần xã Bắc Đại Tây Dương nhìn chung cao hơn ở quần xã Nam Đại Tây
Dương (Hình 1a, Hình bổ sung 6, 7, Figshare: Bộ dữ liệu 2).
Cây được hiệu chỉnh theo thời gian ước tính rằng tổ tiên chung của tất cả các
loài cá ngựa còn tồn tại đã sống ~ 20–25 Ma (triệu năm trước) (Hình 2a, Hình
bổ sung. Figshare: Bộ dữ liệu 3–6), trùng với thời điểm bắt đầu một thời kỳ sự
đa dạng hóa bùng nổ ở hầu hết các loài cá biển và san hô hiện đại. Quần đảo Ấn-
Úc được xác định là trung tâm nguồn gốc của chi Hippocampus, phù hợp với
các nghiên cứu trước đây (Hình 2b, Hình bổ sung 9). Sau đó, cá ngựa đa dạng
hóa và lan rộng trên toàn cầu, với các tuyến đường xâm chiếm và động lực của
chúng có mối liên hệ chặt chẽ với các dòng hải lưu phổ biến và các sự kiện kiến
tạo (xem Văn bản bổ sung). Cây loài của chúng tôi dựa trên 2.000 loci gợi ý
rằng H. bụng là dòng dõi chị em với một nhánh chứa tất cả các loài cá ngựa
khác, và nhánh sau được chia thành hai nhánh phát sinh chủng loại chính: nhánh
I bao gồm tám loài độc quyền sinh sống ở Ấn Độ Dương-Thái Bình Dương,
trong khi nhánh II bao gồm sáu loài sống ở Đại Tây Dương, một loài từ Đông
Thái Bình Dương và năm loài từ Ấn Độ Dương-Thái Bình Dương (Hình 2a,
Hình bổ sung 9). Mô tả chi tiết hơn về nhánh II minh họa sự phụ thuộc của cá
ngựa vào dòng hải lưu như một phương tiện phân tán ở khoảng cách xa và cho
thấy các tuyến đường biển tạm thời có thể tăng cường hoặc hạn chế sự đa dạng
hóa và phân tán như thế nào.
Các tuyến đường đa dạng hóa và xâm chiếm nhanh chóng của nhánh II.
Sau khi tách khỏi nhánh I bằng cách phân tán vào Tây Ấn Độ Dương vào
khoảng 18,2 Ma, tổ tiên của dòng dõi Nam Đại Tây Dương và Bắc Đại Tây
Dương đã tách ra khỏi nhau khoảng 15,2 Ma (Hình 2a). Dòng Bắc Đại Tây
Dương đi theo các dòng hải lưu theo hướng tây bắc và đi qua Biển Tethys vài
triệu năm trước khi Đường biển Đông Tethys bị đóng cửa ban đầu do sự dịch
chuyển kiến tạo khoảng 14 Ma. Phù hợp với lộ trình xâm chiếm này của dòng
dõi Bắc Đại Tây Dương, người ta đã phát hiện ra một nút thắt di truyền mạnh
mẽ trong quần thể tổ tiên của chúng (ủng hộ quan điểm rằng sự phân tán của tổ
tiên đặc biệt phổ biến ở cá ngựa), tuy nhiên, sự mở rộng quần thể nhanh chóng
đã được phát hiện sau khi vượt Đại Tây Dương vào giữa Miocene (Hình 2a, b,
Hình bổ sung 10). Như đã đề xuất trước đây, tổ tiên của H. hippocampus đã tách
ra khỏi dòng dõi Bắc Mỹ bằng cách băng ngược Đại Tây Dương qua Dòng Vịnh
(một tuyến đường phân tán vẫn còn hiệu lực cho đến ngày nay) và xâm chiếm
Đông Đại Tây Dương trong Pliocene.
Đối với nhiều loài động vật biển sinh sống ở vùng nông của Biển Ả Rập, việc
đóng cửa Đường biển Đông Tethys đã dẫn đến sự gia tăng đa dạng sinh học,
giống như đối với cá ngựa, dẫn đến trung tâm đa dạng sinh học thứ hai trong

nhóm này. Ví dụ, khoảng 13 Ma, tổ tiên của H. kelloggi và H. spinosissimus đã


nổi lên như một dòng dõi mới bằng cách phân tán trở lại Quần đảo Ấn-Úc. Sự
kiện này có thể đã được tạo điều kiện thuận lợi bởi Dòng chảy ngược xích đạo
được tăng cường ở Ấn Độ Dương sau khi Đường biển Tethys đóng cửa, và do
đó góp phần thêm vào tính đa dạng cao ở trung tâm đa dạng sinh học cá ngựa
ban đầu (Hình 2c, d).

Dòng dõi cá ngựa Nam Đại Tây Dương tách ra và phân tán từ biển Ả Rập về
phía nam, dọc theo phía Đông lục địa châu Phi. Việc đóng cửa Đường biển
Tethys có thể đã tăng cường dòng hải lưu ven biển Đông Phi và dòng hải lưu
Agulhas, có khả năng hỗ trợ cho cuộc di cư đường dài về phía nam này. Dòng
dõi này đã vượt qua Mũi Hảo Vọng, một nút thắt phân tán nghiêm trọng có thể
xảy ra phản ánh quy mô quần thể cực kỳ thấp của dòng dõi này ~ 4,8–3,6 Ma, và
xâm chiếm các bờ biển phía Nam và Tây Phi (H. capensis và H. algiricus, tương
ứng) .
Sau cuộc xâm lược Đại Tây Dương lần thứ hai vào đầu thế Pliocene, tổ tiên của
các dòng dõi Nam Mỹ đã vượt Đại Tây Dương và xâm chiếm các bờ biển Nam
Mỹ, với H. ingens nổi lên từ một dòng dõi sớm đã xâm chiếm phía bắc Nam
Mỹ. Theo các nghiên cứu trước đây, chúng tôi cũng phát hiện ra rằng dòng dõi
này đã vượt qua Đường biển Panama trước khi đóng cửa lần cuối, nơi nó phát
triển mạnh thể hiện qua quy mô quần thể hiệu quả trung bình lớn (Hình 2a, d).
Sau đó, dòng dõi thứ hai đã vượt qua Nam Đại Tây Dương thành công khoảng
700 nghìn năm trước đây và xâm chiếm bờ biển phía bắc Nam Mỹ và Caribe,
nơi H. reidi tiến hóa. Quy mô quần thể hiệu quả trung bình của dòng cá ngựa
này vẫn tương đối nhỏ, có thể vì nó không thể lan sang Đông Thái Bình Dương
do đường biển Panama bị đóng cửa trước đó và bất lợi về cạnh tranh vì môi
trường sống của nó có thể trùng lặp với môi trường sống của các loài cá ngựa
khác, chẳng hạn như H. cương cứng (Hình 2d). Việc vượt qua Nam Đại Tây
Dương nhiều lần bằng cách đi bè dọc theo Benguela & Nam Xích đạo đã được
đề xuất trước đây. Thật vậy, dòng gen đang diễn ra từ H. algiricus Tây Phi vào
Nam Mỹ
Quần thể H. reidi với dòng gen ít rõ rệt hơn theo hướng ngược lại ủng hộ quan
điểm cho rằng việc đi bè dọc theo các dòng hải lưu này đã tạo điều kiện thuận
lợi cho con đường xâm chiếm này (Hình 3a).
Do đó, sự đa dạng hóa toàn cầu của cá ngựa liên quan đến sự phân tán ở khoảng
cách xa và được tạo điều kiện thuận lợi bởi động lực biển cổ và sự thay đổi dòng
hải lưu. Cụ thể, các phân tích của chúng tôi cuối cùng đã xác nhận rằng cá ngựa
Ấn Độ-Thái Bình Dương đã xâm chiếm bờ biển phía đông châu Mỹ thông qua
hai tuyến đường riêng biệt và theo hai đợt, một chủ đề trước đây đã được tranh
luận: thứ nhất, bằng cách xâm chiếm vùng biển tĩnh lặng.
Hình 2 Lịch sử thuộc địa và nhân khẩu học của cá ngựa. cây phát sinh gen và ước tính thời gian phân kỳ cho 21
loài cá ngựa. Độ dày của đường nhánh tương ứng với ước tính kích thước quần thể (Ne) và màu sắc biểu thị các
dòng dõi khác nhau. Ký hiệu I–III biểu thị các điểm hiệu chuẩn. b - d Các tuyến đường thuộc địa được dự đoán
(mũi tên màu) của cá ngựa dựa trên thời gian phân kỳ, phân bố, các sự kiện gián tiếp và dòng hải lưu (mũi tên
trắng). Các bản đồ được sửa đổi từ Ron Blakey © 2016 Colorado Plateau Geosystems Inc (Giấy phép số
60519). b Quần đảo Ấn-Úc là trung tâm nguồn gốc (đánh dấu màu đỏ) của chi Hippocampus trước khi cá ngựa
đa dạng hóa và phân tán trên toàn cầu 18–23 Ma. c Cá ngựa ban đầu xâm chiếm Đại Tây Dương thông qua
tuyến đường biển Tethyan mở, sau khi đóng cửa (Sự kiện cuối cùng trong 7–13 Ma), đã tách dòng Tethyan này
khỏi dòng dõi chị em Ấn Độ Dương của nó. Sau này, loài này nhanh chóng đa dạng hóa (đánh dấu màu vàng) ở
Biển Ả Rập, thiết lập trung tâm đa dạng hóa cá ngựa thứ hai. d Sự kiện cá ngựa xâm chiếm Đại Tây Dương lần
thứ hai xảy ra từ Ấn Độ Dương khoảng 5 triệu năm khi đi qua mũi Nam Phi và cuối cùng đến Đông Thái Bình
Dương qua tuyến đường biển Panama vẫn còn rộng mở khoảng 3,6 triệu năm. Dữ liệu nguồn có sẵn tại
Figshare (Bộ dữ liệu 4–6)

mở đường biển Tethys và sau đó vượt Đại Tây Dương, và sau đó đi qua Mũi
Hảo Vọng của Nam Phi. Điều thú vị là, làn sóng thứ hai chỉ xảy ra vào đầu thế
Pliocene, có khả năng được tạo điều kiện thuận lợi bởi sự thay đổi trong động
lực dòng hải lưu ở Nam Đại Tây Dương và Caribe do Đường biển Panama tiếp
tục đóng cửa. Những phát hiện này mâu thuẫn với một nghiên cứu gần đây cho
rằng chỉ có một khu định cư thông qua tuyến đường Nam Phi và do đó nhấn
mạnh tầm quan trọng của sự đại diện loài rộng rãi trong nghiên cứu địa sinh học.
Như đã nêu ở trên, những thay đổi kiến tạo và những thay đổi tiếp theo trong
động lực dòng hải lưu có thể đã tạo điều kiện thuận lợi cho một số sự kiện phân
tán và đa dạng hóa lớn ở cá ngựa, tuy nhiên, những thay đổi ngắn hạn hơn về
mực nước biển cũng có thể ảnh hưởng mạnh mẽ đến sự tiến hóa của các sinh vật
biển sống ở vùng nước nông, ví dụ: ví dụ bằng cách thay đổi số lượng môi
trường sống phù hợp trong một khu vực nhất định hoặc thay đổi cấu trúc của nó.
Những biến động về quy mô dân số hiệu quả (Nes) đã được ước tính từ 1 triệu
năm trước (Hình 3b, Figshare: Bộ dữ liệu 7). Khi những biến động như vậy kể
từ đỉnh băng hà cuối cùng (~120 nghìn năm trước đến ~10 nghìn năm trước)
được so sánh với những biến động về mực nước biển, chủ yếu được thúc đẩy bởi
sự thay đổi nhiệt độ toàn cầu (thông qua các băng hà), các mô hình cho thấy tác
động phức tạp của nước biển. mức trên Ne (Hình 3c). Quy mô quần thể hiệu quả
của một số loài cá ngựa dường như có mối liên hệ tích cực với khí hậu ấm áp và
do đó mực nước biển cao, như được đề xuất bởi cực đại địa phương về quy mô
quần thể hiệu quả sau thời kỳ ấm áp ~ 115 nghìn năm trước với độ trễ vài nghìn
năm. Những loài này bao gồm H. hippocampus (loài duy nhất ở châu Âu được
xem xét), H. casscsio, H. fuscus (cả hai dòng này đều có phạm vi phân bố hạn
chế ở và phía nam Biển Đỏ và bờ biển Đông Phi) và H. subelongatus (chỉ được
tìm thấy ở bờ biển Tây Úc). Quy mô quần thể hiệu quả của nhiều loài khác cho
thấy mối liên hệ tiêu cực hơn với mực nước biển với mức tối đa cục bộ ở Ne
trùng với mức tối thiểu cục bộ ở mực nước biển. Những loài này bao gồm H.
ingens (loài duy nhất được coi là phân bố dọc theo phía Thái Bình Dương của
lục địa châu Mỹ), H. spinosissimus và H. trimaculatus, hai loài phân bố rộng
khắp khu vực Sundaic. Tuy nhiên, một số loài không có kích thước Ne cao nhất
có thể liên quan đến mực nước biển cao hoặc thấp và các yếu tố khác có thể có
ảnh hưởng mạnh hơn đến quy mô quần thể. Ví dụ, các loài sống ở quần xã Bắc
Đại Tây Dương (H. erectus, H. hippocampus & H. zosterae) nhìn chung có Ne
lớn hơn hầu hết các dòng khác (ví dụ, những loài sống ở Nam Đại Tây Dương)
cho thấy loại quần xã có thể ảnh hưởng đến loài Nes. Hơn nữa, một số loài có
thể có khả năng chống chịu tốt hơn trước những dao động của mực nước biển
hoặc mất môi trường sống do băng hà gây ra so với những loài khác do khả năng
phân tán tăng lên (ví dụ, bằng cách đi bè) hoặc do có sẵn nơi trú ẩn trong khu
vực từ băng hà.

Sự tiến hóa hội tụ của kiểu hình thích nghi. Trong quá trình đa dạng hóa trên
toàn thế giới, cá ngựa phải thích nghi với những điều kiện đa dạng
Hình 3 Dòng gen và những biến động trong quy mô quần thể hiệu quả. một dòng gen được phát hiện giữa các
loài sống ở Nam Đại Tây Dương. Dòng gen được hiển thị gần các đường màu trắng khi tốc độ di cư được suy ra
bởi G-PhoCS. Độ dày và hướng của mũi tên tương ứng với tốc độ và hướng của dòng gen. Các bản đồ được sửa
đổi từ Ron Blakey © 2016 Colorado Plateau Geosystems Inc (Giấy phép số 60519). Dữ liệu nguồn được cung
cấp trong Bảng bổ sung 10. b Biến động về quy mô dân số hiệu quả của PSMC. Trục x biểu thị thời gian tính
bằng năm trước hiện tại trong khi trục y biểu thị quy mô dân số hiệu quả. Các biểu đồ được tổ chức chủ yếu
theo sự phân bố địa lý của từng loài với các vùng phân bố khác nhau. Dữ liệu nguồn được cung cấp dưới dạng
tệp Dữ liệu Nguồn. c Sự thay đổi mực nước biển trong 1 triệu năm qua tính bằng mét. Đường màu vàng biểu thị
đỉnh liên băng toàn cầu cuối cùng trong khi màu lục lam biểu thị khoảng thời gian cực đại cuối cùng của băng
hà.

sự kết hợp của các yếu tố phi sinh học và sinh học dẫn đến kiểu hình thích nghi
độc đáo. Cá ngựa trưởng thành chỉ có tương đối ít kẻ săn mồi do khả năng ngụy
trang tuyệt vời và các tấm xương và gai kém hấp dẫn. Các gai, có nguồn gốc từ
các tấm loại L bao phủ bề mặt ngay dưới da của cá ngựa, có hình thái tương tự
như các gai da hình kim cương bao phủ bề mặt da ở cá nóc, là những dẫn xuất
có quy mô cực lớn. Động vật có xương sống có rất nhiều cấu trúc có nguồn gốc
từ da, bao gồm vảy cá, vảy bò sát, lông chim và lông động vật có vú. Mặc dù
cấu trúc da không tương đồng về mặt cấu trúc nhưng chúng dường như được
kiểm soát bởi các cơ chế di truyền được bảo tồn cao giữa các nhóm động vật có
xương sống khác nhau. Các nghiên cứu trước đây đã chỉ ra rằng các con đường
Hh, Fgf, Bmp, Wnt/-catenin và Eda có liên quan đến việc phát triển quy mô
teleost. Có khả năng là các cấu trúc da teleost (ngay cả khi được biến đổi mạnh
mẽ) có chung các yếu tố chung của các con đường truyền tín hiệu cốt lõi này
được biết là có tác dụng củng cố sự phát triển cấu trúc da ở các nhóm động vật
có xương sống khác nhau. Cá ngựa cũng đã phát triển các biến thể về mức độ
bao phủ cơ thể bằng gai, điều này có thể giúp chúng thích nghi với các hốc sinh
thái đa dạng. Điều thú vị là các loài có gai xương được phát hiện là không có
quan hệ họ hàng gần gũi với cây loài của chúng ta: H. spinosissimus, H.
jayakari, H. histrix, và H. barbouri. Điều này xác nhận những phát hiện trước đó
và gợi ý rằng một số dòng dõi phải chịu áp lực môi trường tương tự, chẳng hạn
như các loại động vật ăn thịt cụ thể, đã tiến hóa các kiểu hình tương tự một cách
độc lập (Hình 4 và Hình bổ sung 11). Cá ngựa gai sinh sống ở phía bắc và phía
tây Ấn Độ Dương lần lượt tách ra khỏi dòng dõi chị em 8,7 và 7,8 Ma của
chúng, trong khi cá ngựa gai sống ở Thái Bình Dương tách ra khỏi dòng dõi chị
em 14,7 và 6,8 Ma (Hình bổ sung 11).
Để nghiên cứu cơ sở phân tử của kiểu hình thích nghi tiến hóa liên tục này,
chúng tôi đã thực hiện phân tích chọn lọc tích cực để nghiên cứu xem liệu tỷ lệ
tốc độ đột biến không đồng nghĩa/đồng nghĩa tăng tốc (dN/dS) có thể được phát
hiện trên các nhánh của cá ngựa gai so với các dòng không có gai hay không.
Bằng cách sử dụng chương trình codeml trong PAML, chúng tôi đã xác định
chính thức 37 gen dưới sự chọn lọc tích cực với các tín hiệu dN/dS được tăng
tốc ở cá ngựa gai (p < 0,001, Dữ liệu bổ sung 3, Figshare: Bộ dữ liệu 8). Cây
protein thu được từ trình tự axit amin của tất cả 37 gen cho thấy bốn loài cá
ngựa gai không có quan hệ họ hàng gần gũi với nhau (Hình 4, Figshare: Bộ dữ
liệu 9), cho thấy kiểu hình gai có khả năng tiến hóa độc lập. Cụ thể, bốn dòng cá
ngựa gai biểu hiện những thay đổi axit amin độc lập trong gen protein hình thái
xương 3 (bmp3) (Hình 4a), và các thử nghiệm McDonald và Kreitman chính
quy và tổng quát (MKT) cho thấy bmp3 tiến hóa dưới sự chọn lọc tích cực (chỉ
số trung tính < 1, Kiểm tra chi bình phương p <0, 05) (Hình 4a, b, Dữ liệu bổ
sung 4). Các gai xuất hiện trong phôi của nhiều loài syngnathid (bao gồm cả H.
erectus) và bị mất đi ở một số loài thứ hai trong quá trình trưởng thành. Mặc dù
kiểu hình gai có thể có cơ sở đa gen, nhưng các phép lai tại chỗ toàn bộ thể hiện
biểu hiện bmp3 trong giai đoạn phát triển ban đầu của gai cá ngựa ở H. erectus,
một loài có giai đoạn trưởng thành không có gai phát triển tốt (Hình 4d, Hình bổ
sung . 12a). Là một yếu tố phiên mã, bmp3 đã được chứng minh là điều chỉnh
tiêu cực sự biệt hóa nguyên bào xương (và do đó khối lượng xương) ở động vật
có vú, cho thấy rằng các vị trí khác nhau trong gen này giữa cá ngựa có gai và
không có gai có thể ảnh hưởng đến sự tương tác điều hòa của nó với các gen ở
hạ nguồn và do đó góp phần vào sự phát triển nhanh chóng của cột sống ở
những loài có trình tự peptide dẫn xuất. Hơn nữa, một thí nghiệm loại trực tiếp
sử dụng CRISPR/Cas9 ở cá ngựa vằn cho thấy các đột biến có một loạt quy mô
đáng kể.
Hình 4 Sự tiến hóa của gai. cây bên trái, thể hiện sự tiến hóa độc lập của gai ở cá ngựa. Độ dài
nhánh cho biết số lượng thay thế trên mỗi trang web. Bốn loài cá ngựa có gai được tô màu xanh lam.
Các nhánh dày hơn tương ứng với tỷ lệ thay thế từ không đồng nghĩa sang đồng nghĩa (dN/dS) cao
hơn đối với gen bmp3. Thử nghiệm McDonald và Kreitman tổng quát và tổng quát (MKT) đối với gen
bmp3 đã được thực hiện cho ba loài chị em theo cặp với các đặc điểm có gai và không có gai khác
nhau được đánh dấu bằng màu nền, mức ý nghĩa của chúng được biểu thị bằng giá trị p với phông
chữ màu xanh lam và đỏ tương ứng. Đúng vậy, so sánh sự thay thế axit amin trong protein bmp3, sự
thay thế đa hình và cố định ở cá ngựa gai lần lượt được biểu thị bằng các vòng tròn màu đỏ và xanh
lam. b Phân bố giá trị dN/dS trong bmp3 ở cá ngựa có gai so với các loài không có gai. c Sự tiến hóa
độc lập trong cây phát sinh gen được xây dựng lại cho protein được mã hóa bởi bmp3. Hình minh họa
cá ngựa của Geng Qin. d Lai toàn bộ tại chỗ của bmp3 ở Hippocampus erectus. Ảnh chụp cá ngựa tại
chỗ của Ralf F. Schneider. Dữ liệu nguồn được cung cấp dưới dạng tệp Dữ liệu Nguồn.

các khiếm khuyết, chẳng hạn như giảm số lượng tỷ lệ, sắp xếp lại và hình dạng
không đều, xác nhận rằng bmp3 đóng vai trò trong việc hình thành xương hạ bì
trong các xương tele và do đó cũng có thể là cả gai (Hình bổ sung 12b, c).
Sự tiến hóa độc lập của các kiểu hình thích nghi phức tạp, chẳng hạn như kiểu
hình cột sống, cho thấy cá ngựa có khả năng tiến hóa nói chung cao, phù hợp
với tốc độ tiến hóa nucleotide cao đã được báo cáo và tỷ lệ đa dạng hóa cao của
Hippocampus mà chúng tôi đã báo cáo ở đây (Hình bổ sung. 1, Figshare: Bộ dữ
liệu 1). Do đó, khả năng thích ứng nhanh chóng với môi trường mới và phản
ứng với các chế độ chọn lọc đã thay đổi có thể, cùng với các phương tiện phân
tán không chính thống bằng cách đi bè dọc theo các dòng hải lưu, là nguyên
nhân dẫn đến một số thành công trong quá trình tiến hóa của cá ngựa khi đa
dạng hóa trên toàn cầu.
Để kết luận, chúng tôi báo cáo rằng cá ngựa phân tán trên những khoảng cách xa
đáng kinh ngạc và sự đa dạng hóa được hỗ trợ bằng cách thay đổi các dòng hải
lưu và các sự kiện kiến tạo. Chúng bao gồm hai cuộc xâm lược độc lập vào Đại
Tây Dương từ Tây Ấn Độ Dương, một trong số đó được tạo điều kiện thuận lợi
nhờ việc mở Đường biển Đông Tethys lần cuối và cuộc còn lại bằng cách đi qua
Mũi Hảo Vọng và cuối cùng là việc thuộc địa hóa Đông Thái Bình Dương thông
qua đường biển Panama. Sự tiến hóa hội tụ của các đặc điểm thích nghi, chẳng
hạn như trong trường hợp các gai da bảo vệ tiến hóa lặp đi lặp lại cho thấy rằng
các con đường phát triển-di truyền đã được tuyển dụng nhiều lần một cách độc
lập và có lẽ là để đáp ứng với áp lực săn mồi.

Methods
Ước tính tỷ lệ đa dạng hóa trong Syngnathidae. Trình tự DNA của 138 loài
thuộc họ Syngnathidae và một nhóm ngoại được lấy từ
những nghiên cứu trước đây. Sau khi căn chỉnh trình tự bằng Clustal Omega
(v1.2.4), một
cây phát sinh chủng loại được nối đã thu được bằng RAxML (v8) bằng phương
pháp tìm kiếm cây có khả năng tối đa đạt điểm cao nhất (tùy chọn -a) bằng mô
hình GTRGAMMA và bao gồm 1.000 lần sao chép bootstrap. Sự phân kỳ tương
đối được ước tính bằng chương trình python wLogDate. Tỷ lệ đa dạng hóa (tức
là sự hình thành loài trừ đi sự tuyệt chủng) được ước tính bằng cách sử dụng
BAMM 2.5. Chúng tôi đã tính đến việc lấy mẫu phân loại không đầy đủ không
ngẫu nhiên bằng cách bao gồm tỷ lệ phân loại bị thiếu trên mỗi chi (xác suất
mẫu trong Dữ liệu bổ sung 5) cũng như các chi được lấy mẫu tổng thể (= 0, 84).
Các ưu tiên được tạo bằng setBAMMpriors trong BAMMtools. Các phân tích
được thực hiện cho 5 × 10 thế hệ, lấy mẫu cứ sau 1000 thế hệ và với tỷ lệ đốt
cháy 25%. Trình tự DNA và cây phát sinh gen ước tính có sẵn tại Figshare (Bộ
dữ liệu 1).

Trình tự đọc dài và lắp ráp bộ gen Hippocampus erectus. Một con H. erectus đực
trưởng thành được nuôi trong trang trại thủy sản ở tỉnh Phúc Kiến, Trung Quốc,
đã được sử dụng để lắp ráp bộ gen de novo. DNA bộ gen được chiết xuất từ cơ
đuôi bằng cách sử dụng quy trình chiết xuất phenol/chloroform tiêu chuẩn.
Trình tự đơn phân tử, thời gian thực (SMRT) đã được thực hiện bằng cách sử
dụng tổng cộng 5 μg DNA bộ gen để tạo ra thư viện 20 kb theo hướng dẫn của
nhà sản xuất (Pacific Bioscatics, USA). Các lần đọc con thu được sau khi chọn
kích thước trên hệ thống Blue- Pippin (Sage Science, Hoa Kỳ). Giải trình tự bộ
gen SMRT đã được thực hiện trên nền tảng PacBio Sequel (Pacific Bioscatics,
USA) với phạm vi bao phủ xấp xỉ 113 lần.
Các lần đọc có chất lượng thấp hơn 0,75 và độ dài ngắn hơn 500 bp đã bị loại
trừ và các lần đọc con 6,01 M bao gồm tổng cộng 47,88 Gb được giữ lại để lắp
ráp (đọc con dài nhất = 71,17 kb, độ dài trung bình = 7,97 kb). Bộ gen dự thảo
được tập hợp bằng WTDBG (//github.com/ruanjue/wtdbg). Các chuỗi trình tự
sau đó được sửa lỗi bằng Pilon. Đánh giá tính toàn vẹn của các trình tự được lắp
ráp, ước tính kích thước bộ gen, dự đoán yếu tố có thể thay thế và chú thích bộ
gen được mô tả trong Thông tin bổ sung (Phương pháp bổ sung, Bảng bổ trợ 2–
4, Dữ liệu bổ sung 1).
Giàn giáo bộ gen dựa trên cấu trúc nhiễm sắc thể thông lượng cao (Hi-C). Một
con H. erectus đực trưởng thành được nuôi trong trang trại đã được sử dụng để
phân tích Hi-C. Thư viện được chuẩn bị theo giao thức Hi-C tại chỗ tiêu chuẩn
cho các mẫu máu, sử dụng DpnII (NEB, Ipswich, USA) làm enzyme giới hạn.
Một bước tuần hoàn hóa tiêu chuẩn đã được thực hiện, sau đó là chuẩn bị các
quả cầu nano DNA (DNB) theo giao thức chuẩn của nền tảng giải trình tự
BGISEQ-500. Thư viện sau đó được giải trình tự bằng chiến lược PE100 sử
dụng nền tảng BGISEQ-500. Kiểm soát chất lượng và đánh giá thư viện được
mô tả trong Phương pháp bổ sung.
Để căn chỉnh Hi-C và định hướng nhiễm sắc thể, trước tiên chúng tôi xây dựng
một ma trận tương tác dựa trên các lần đọc hợp lệ. Sau đó, phần mềm ICE được
sử dụng để hiệu chỉnh bất kỳ ưu tiên nào của locus được cắt bằng enzyme do sự
phân bố hàm lượng GC không đồng đều. Sau đó, các cặp hợp lệ được truy xuất
(319.356.098) được sử dụng để định hướng và neo các nhánh PacBio vào các
siêu giàn giáo (nhiễm sắc thể) áp dụng đường ống 3D-DNA với tham số chính là
'-m đơn bội -s 4 -c 22'. Các bản đồ liên hệ sau đó được tạo bằng quy trình Juicer
và ranh giới cho từng nhiễm sắc thể được chỉnh sửa thủ công bằng cách trực
quan hóa tệp inter.hic trong Juicebox, kết hợp thông tin liên kết từ tệp agp.

Sắp xếp lại trình tự chuẩn bị mẫu, lập bản đồ và gọi biến thể. Chúng tôi đã lấy
mẫu tổng cộng 358 mẫu cá ngựa từ 21 loài đại diện cho dòng dõi chính của chi
Hippocampus (Hình 1a, Dữ liệu bổ sung 2), bao gồm 13 đến 22 cá thể mỗi loài,
ngoại trừ H. cassisio, H. capensis và H. Camelopardalis, đại diện lần lượt là 8, 7
và 2 cá thể. Việc phân loại từng mẫu vật dựa trên bằng chứng hình thái và di
truyền. DNA bộ gen là
được chiết xuất từ cơ đuôi bằng phương pháp chiết xuất phenol/chloroform tiêu
chuẩn và được sử dụng để xây dựng thư viện giải trình tự có kích thước chèn
khoảng 350 bp.
Các thư viện kết hợp được sắp xếp theo trình tự trên nền tảng Illumina HiSeq
4000. Một mẫu ngẫu nhiên cho mỗi loài được giải trình tự ở mức độ bao phủ ~
20 lần và phần còn lại được giải trình tự ở mức độ bao phủ ~ 10 lần.
Sau khi loại bỏ các bộ điều hợp và các lần đọc chất lượng thấp (Phương pháp bổ
sung), các lần đọc rõ ràng cho từng cá nhân được ánh xạ tới cả trình tự bộ gen
PacBio của H. erectus và trình tự bộ gen Illumina của H. sử dụng BWA-MEM
với các tham số mặc định (v0 .7.17). Chúng tôi đã tính toán tốc độ ánh xạ, độ
sâu và phạm vi bao phủ của bộ gen bằng SAMtools (v1.6) sau khi sắp xếp và
loại bỏ các bản sao. Bộ gen Hippocampus erectus PacBio được lắp ráp sau đó
được sử dụng làm bộ gen tham chiếu.
Bằng cách chỉ định 21 loài, chúng tôi sau đó đã thực hiện lệnh gọi biến thể cho
tất cả 358 cá thể bằng FreeBayes v9.9.2. Bộ lọc ánh xạ và chất lượng cơ sở được
sử dụng làm mặc định trong FreeBayes (cờ bộ lọc tiêu chuẩn). Chi tiết được thể
hiện trong Phương pháp bổ sung. Tập dữ liệu được lọc sau đó được chú thích
theo H. erectus
bộ gen sử dụng gói ANNOVAR63
Phân tích đa dạng di truyền và phân kỳ. Sự phân kỳ gen giữa các loài được tính
toán cho từng cặp trong số 21 loài cá ngựa, sử dụng mẫu vật có độ bao phủ nếp
gấp theo trình tự cao nhất cho mỗi loài. Chúng tôi cũng đã tính toán khoảng
cách di truyền theo cặp trong số tất cả 358 mẫu bằng cách sử dụng PLINK
(v1.9) với tham số chính '–distance 1-ibs flat-missing'. Sau đó, cây nối hàng xóm
(NJ) đã được xây dựng bằng MEGA7. Phân tích thành phần chính (PCA) được
thực hiện bằng chương trình smartPCA trong EIGENSOFT (v6.1.4).
Ngoài ra, chúng tôi còn phân tích sự đa dạng nucleotide nội bộ cụ thể bằng cách
sử dụng ANGSD (v 0.924) bằng cách sử dụng phương pháp cửa sổ trượt như đã
nêu trong Phương pháp bổ sung. Cả hai công cụ ước tính Watterson (θw) và cặp
(θπ) của theta đều được sử dụng để phân tích đa dạng nucleotide (Figshare:
Dataset 2). Các gói R 'vioplot' và 'circlize' đã được sử dụng để khám phá sự đa
dạng nucleotide giữa các loài và nhiễm sắc thể khác nhau.

Các mô hình thuộc địa hóa toàn cầu. Đối với các phân tích phát sinh loài của
chúng tôi, các họ gen đầu tiên của Syngnathus scovelli, H. erectus và H. Comes
đã được xác định bằng cách sử dụng Treefam. Sau khi lọc các gen chất lượng
thấp bằng codon kết thúc sớm hoặc trong đó số cơ sở của vùng mã hóa không
phải là bội số của ba, các phân tích họ gen đã được thực hiện và xác định 5.475
bản chỉnh hình đơn bản sao10. Việc sắp xếp theo cặp cho H. erectus và S.
scovelli đã được tiến hành bằng cách sử dụng các chuỗi trò đùa v.140603 và
CDS cho 2.000 chỉnh hình (được chọn ngẫu nhiên từ các mẫu đã đề cập ở trên)
sau đó được trích xuất cho từng mẫu dựa trên bộ dữ liệu SNP (Figshare: Bộ dữ
liệu 3) .
Một cây phát sinh chủng loại dựa trên sự hợp nhất đã được xây dựng bằng
ASTRAL-III v5.6.1, với tổng số 2.000 cây gen độc lập và bao gồm từ một đến
năm mẫu vật cho mỗi loài (tổng cộng 103 mẫu vật). Các locus được chọn có độ
dài trung bình là 1.548 (± 1.325), các vị trí phân tách trung bình là 18% (± 4%)
và dữ liệu bị thiếu trung bình là 1%. Cây gen được tạo bằng RAxML (v8) bằng
cách sử dụng phân tích bootstrap nhanh và tìm kiếm cây có khả năng ghi điểm
tối đa tốt nhất (tùy chọn a) theo mô hình thay thế GTR + G và bao gồm 100 bản
sao bootstrap. Ma trận DNA, cây gen và suy luận ASTRAL có sẵn tại Figshare
(Bộ dữ liệu 4).
Để có được ước tính thời gian phân kỳ của các nút trong cây loài Hippocampus,
100 locus được lấy mẫu ngẫu nhiên cho cùng một đến năm cá thể trên mỗi loài
(từ danh sách trên; tổng cộng 103 cá thể), sử dụng gói starBEAST2 được triển
khai trong BEAST v2.476 . Các locus được chọn cho phân tích này có trung
bình 1.579 bp (± 1.060), các vị trí phân tách trung bình là 18% (± 4%) và 1% dữ
liệu bị thiếu. Đối với các điểm hiệu chuẩn, chúng tôi đã sử dụng dữ liệu từ công
trình cổ sinh vật học của Hippocampus và các nhóm ngựa ống và ngựa ống lùn
có liên quan khác. Do đó, bằng cách sử dụng phân phối logic chuẩn như
hyperprior, trước tiên chúng tôi đã hiệu chỉnh nguồn gốc của chi Hippocampus ở
độ tuổi trẻ nhất có thể là 11,6 Ma mà hóa thạch Hippocampus đã được ghi lại
cũng như sự tồn tại của ngựa ống và ngựa ống lùn đã được chứng minh (Bảng
bổ sung 9). Do đó, điều trước đây giả định rằng chi Hippocampus có nguồn gốc
trước khi xuất hiện hóa thạch lâu đời nhất được biết đến của Hippocampus (H.
samarticus), và chúng tôi cũng nới lỏng khoảng 95% HPD để phù hợp với sự
không chắc chắn (95% HPD: 14,4-31,8). Thứ hai, chúng tôi đã kết hợp thông tin
về hóa thạch H. sarmaticus từ Miocene với tư cách là tổ tiên của H. trimaculatus
bằng cách sử dụng phân bố logic chuẩn với giá trị trung bình là 11,8 Ma để dẫn
đến trung vị gần bằng 11,6 Ma và độ lệch chuẩn được đặt thành độ không đảm
bảo của mô hình, bao gồm toàn bộ giới hạn trên của Miocen giữa đến Miocen
muộn (95% HPD: 8,32-16,1 Ma). Cuối cùng, theo Teske và Beheregaray, chúng
tôi đặt sự khác biệt giữa H. reidi và H. ingens ở mức tối thiểu là 2,8 Ma, tương
ứng với mối liên hệ cuối cùng giữa Caribe và Thái Bình Dương80. Mặc dù
người ta đã lập luận rằng các trầm tích ở Colombia hỗ trợ cho sự tồn tại của sự
đóng cửa tạm thời Miocene của đường biển Panama, nhưng trong nghiên cứu
này, chúng tôi đã sử dụng một phương pháp bảo thủ trước đó bằng cách đặt thời
gian phân kỳ tối thiểu có thể có giữa các dòng này là 2,8 Ma và cũng cho phép
siêu ưu tiên bao trùm các niên đại cũ hơn , với 95% HPD: 3,07-4,64 Ma, cho
rằng O'Dea et al. cho rằng mối liên hệ giữa Đại Tây Dương và Thái Bình Dương
cho phép dòng gen có khả năng tồn tại cho đến 3,2 Ma (giảm dần theo thời
gian). Tất cả các cài đặt còn lại được sử dụng làm mặc định, bao gồm các đồng
hồ nghiêm ngặt không được liên kết và các mô hình thay thế JC69 không được
liên kết giữa các locus. Chúng tôi đã sửa cấu trúc liên kết cây ASTRAL và thực
hiện hai phân tích độc lập trong các bước 160 × 108 của chuỗi MCMC và lấy
mẫu ở mỗi 80.000 thế hệ. Sự hội tụ được chẩn đoán bằng Tracer v1.7. Hai lần
chạy độc lập được kết hợp bằng LogCombiner (có trong gói BEAST v2.4) với tỷ
lệ tiêu hao 10%. Cây có độ tin cậy tối đa thu được bằng cách sử dụng
TreeAnnotator (cũng có trong gói BEAST v2.4). Ma trận DNA và tệp đầu vào
và đầu ra BEAST xml có sẵn tại Figshare (Bộ dữ liệu 5).
Cấu trúc liên kết và độ dài nhánh (thời gian phân kỳ) của cây loài là
được sử dụng để tái tạo lại sự đa dạng hóa địa lý theo hai mô hình đa dạng hóa
khác nhau trong không gian: cảnh quan khuếch tán và không đồng nhất. Cả hai
mô hình đều được chạy trong BEAST v2.4, sử dụng đồng hồ logic chuẩn và tọa
độ đầu khớp với các điểm lấy mẫu và phân bố hiện tại của loài. Đối với mô hình
không đồng nhất, chúng tôi đã đưa vào biến dạng ở các khu vực lục địa bằng
cách tăng ma sát trong tệp kml bên ngoài, để giảm xác suất di chuyển qua
lục địa và các vùng biển lân cận. Chúng tôi đã chạy các giá trị ma sát và biến
dạng khác nhau, bao gồm biến dạng = 10, 20, 50 và 100 và định giá mỗi đa giác
là 2 (biến dạng cao hơn, ma sát cao hơn). Do kết quả có độ tương đồng cao nên
chúng tôi chỉ trình bày kết quả có biến dạng = 20; giá trị = 2 (Hình bổ sung 9a).
Sự hội tụ được chẩn đoán bằng cách sử dụng Tracer và Tree Annotator được sử
dụng để xuất cây cuối cùng với tỷ lệ burn-in 10%. Cuối cùng, chúng tôi đã sử
dụng SPREAD (v1.0.6) để tạo tệp kml và Google Earth Pro để vẽ đồ thị và tạo
hoạt ảnh cho sự đa dạng hóa của chi Hippocampus trong không gian và thời
gian. Tệp đầu vào và đầu ra BEAST xml có sẵn tại Figshare (Bộ dữ liệu 6).

Suy luận nhân khẩu học với G-PhoCS. Tổng cộng có 102 mẫu vật đại diện (2-5
mẫu cho mỗi loài) đã được sử dụng để suy ra lịch sử nhân khẩu học của cá ngựa.
Các locus trung tính được sử dụng để chạy phân tích nhân khẩu học. Chiến lược
lọc được tóm tắt trong Phương pháp bổ sung.
52,2% bộ gen còn lại sau khi lọc, từ đó chúng tôi đã chọn ra 6102 'locus trung
tính' bằng cách xác định các khoảng liền kề 1 kb đã vượt qua bộ lọc. Chúng tôi
đã sử dụng cài đặt mặc định do Gronau và cộng sự chọn: phân phối Gamma (α =
1,0, β = 10.000) cho quy mô dân số có tỷ lệ đột biến (θ) và thời gian phân kỳ (τ)
và Gamma (α = 0,002, β = 0,00001) trước tỷ lệ di chuyển theo tỷ lệ đột biến (m).
Chuỗi Markov khám phá không gian của các giá trị tham số đã được chạy trong
100.000 lần lặp thử và thêm 200.000 lần lặp nữa. Giá trị lấy mẫu trung bình và
khoảng tin cậy Bayesian 95% của từng tham số được tính toán bằng Tracer
v1.7.1. Chúng tôi giả định tỷ lệ đột biến trung bình (μ) là 4,33 × 10−10 mỗi
nucleotide trên mỗi thế hệ và thời gian thế hệ trung bình là một năm đối với loài
Hippocampus. Ước tính quy mô quần thể (Ne) được lấy từ các mẫu có tỷ lệ đột
biến (θ) dựa trên công thức Ne = θ / 4μ. Dòng gen được đo bằng tổng tốc độ di
cư, tức là tốc độ trên mỗi thế hệ nhân với số thế hệ được phép di cư (Hình 3a,
Bảng bổ sung 10).
Suy luận về lịch sử nhân khẩu học từ phân tích PSMC. Các phân tích hợp nhất
Markovian (PSMC) theo thứ tự từng cặp được sử dụng cho một cá thể (có độ
bao phủ bộ gen cao nhất) cho mỗi loài để so sánh giữa các loài. Thông tin kiểu
gen của cá thể được chọn được lấy từ các tệp BAM căn chỉnh bằng
SAMTOOLS. Các biến thể có độ sâu trình tự nhỏ hơn 1/3 độ sâu trung bình
hoặc lớn hơn 2,5 lần đã bị xóa. Chương trình fq2psmcfa được sử dụng để
chuyển đổi trình tự đồng thuận lưỡng bội sang định dạng giống FASTA trong đó
các ký tự biểu thị vị trí dị hợp tử trong các thùng liên tiếp 100 bp. Chương trình
psmc sau đó được sử dụng để suy ra lịch sử quy mô quần thể, trong đó các tham
số được đặt là -N 30 -t 15 -r 5 -p 4 + 25*2 + 4 + 6. Chúng tôi giả định thời gian
thế hệ là 1 năm và a tỷ lệ đột biến (μ) là 4,33×10−10 mỗi nucleotide mỗi thế hệ.

Cơ sở di truyền của đặc điểm cột sống. Bốn loài cá ngựa được sử dụng trong
nghiên cứu này, bao gồm H. spinosissimus, H. jayakari, H. histrix và H.
barbouri, thường có các gai phát triển tốt (Hình 3a, Hình bổ sung 11). Để phát
hiện các gen được chọn lọc tích cực (PSG) có khả năng liên quan đến gai xương,
chúng tôi đã xây dựng lại trình tự gen cho 20 loài cá ngựa (không bao gồm H.
Camelopardalis có độ sâu trình tự cực thấp) bằng cách sử dụng cả SNP và các vị
trí bất biến (bộ gen của H. erectus như
thẩm quyền giải quyết). Các chuỗi codon liên kết cho mỗi gen được phân tích
sâu hơn bằng cách sử dụng chương trình codeml trong PAML để tính toán
dN/dS và chúng tôi đã phát hiện ra sự lựa chọn tích cực trên các nhánh cụ thể
khi xem xét mối quan hệ phát sinh gen giữa 20 loài này (thu được bằng cách sử
dụng ASTRAL; được mô tả trong Phần phân tích phát sinh gen). Các mô hình
thay thế codon 'một tỷ lệ' và 'hai tỷ lệ' đã được xem xét. Mô hình 'một tỷ lệ' giả
định cùng một dN/dS trên tất cả các nhánh trong kiểu phát sinh loài của các loài,
được gọi là 'giả thuyết vô hiệu'. ‘Tỷ lệ hai’
mô hình giả định sự phân kỳ dN/dS cho các nhánh của dòng dõi có gai và không
có gai, là 'giả thuyết thay thế'. Các thử nghiệm tỷ lệ khả năng đã được tiến hành
để so sánh các mô hình nêu trên bằng cách tính toán khả năng tương ứng, giá trị
tới hạn χ2 và giá trị p cho mỗi gen. Chúng tôi đã áp dụng ngưỡng tương đối
nghiêm ngặt là 0,001
để các giá trị p ban đầu ban đầu thu được một bộ 37 gen giả định dưới sự chọn
lọc dương với dN/dS được tăng tốc đáng kể trên các nhánh của dòng cá ngựa gai
(Dữ liệu bổ sung 3).
Để mô tả rõ hơn các gen chức năng có khả năng liên quan đến sự phát triển cột
sống của 37 gen ứng cử viên, chúng tôi đã thực hiện MKT chuẩn và tổng quát
để phát hiện dấu hiệu của chọn lọc tự nhiên dựa trên trình tự gen của quần thể.
Đối với MKT chính tắc, số lượng biến thể không đồng nghĩa (dN) và đồng nghĩa
(dS) giữa ba loài chị em theo cặp có các đặc điểm gai và không gai khác nhau,
chứa H. spinosissimus và H. kelloggi, H. jayakari và H. mohnikei, và H.
barbouri và H. xuất hiện, và các biến thể không đồng nghĩa (Pn) và đồng nghĩa
(Ps) trong loài đã được ước tính, trong đó H. kuda và H. kuda & H. histrix lần
lượt được coi là nhóm ngoài. Theo các thử nghiệm này, chỉ số trung lập (NI =
(Pn/Ps)/(dN/dS)) đã được tính toán và thử nghiệm Chi bình phương đã được
triển khai. NI < 1 cho thấy sự khác biệt cao giữa các loài do chọn lọc tích cực.
Chúng tôi đã thực hiện MKT tổng quát, trong đó, dN và dS, được ước tính là các
biến thể không đồng nghĩa và đồng nghĩa có nguồn gốc từ một trong các loài chị
em có tình trạng cột sống khác nhau, tương phản với các loài tổ tiên và chị em,
sau đó được so sánh với Pn và Ps, về mặt trung tính. , trong dòng dõi này.
Chúng tôi cũng đã triển khai 'Mô hình tỷ lệ tự do' để ước tính tỷ lệ dN/dS thay
đổi trên mỗi nhánh phát sinh gen dựa trên các chuỗi codon được căn chỉnh cho
từng gen trong số 37 gen thông qua phương pháp khả năng tối đa sử dụng
CODEML trong PAML88. Phân phối giá trị dN/dS của 37 PSG giả định ở 20
loài cá ngựa có sẵn tại Figshare (Bộ dữ liệu 8). Bằng cách tích hợp các kết quả
từ các phân tích nêu trên, các gen đồng thời thể hiện tầm quan trọng trong
PAML và MKT, đồng thời thể hiện dN/dS được tăng tốc một cách nhất quán từ
'Mô hình tỷ lệ tự do' trên các nhánh của dòng cá ngựa có gai so với các dòng
không có gai, đặc biệt là với những dòng dõi chị em không có gai, được coi là
những ứng cử viên tự tin cho sự xác nhận thực nghiệm sâu hơn.
Ngoài ra, chúng tôi đã xây dựng lại trình tự CDS của 37 PSG cho 21 loài cá
ngựa (một mẫu có độ bao phủ nếp gấp trình tự cao nhất cho mỗi loài) bằng tập
dữ liệu SNP đã lọc và dịch chúng thành chuỗi protein bằng cách sử dụng các tập
lệnh nội bộ. Chúng tôi đã ước tính các cây protein bằng RAxML (v8) bằng cách
sử dụng phân tích bootstrap nhanh và tìm kiếm cây có khả năng đạt điểm tối đa
tốt nhất (tùy chọn a) theo mô hình thay thế PROTGAMMAGTR và bao gồm
100 lần sao chép bootstrap. Cây protein của 37 PSG này từ 21 loài cá ngựa được
lưu giữ tại Figshare (Bộ dữ liệu 9).
Sau đó, phân tích căn chỉnh nhiều chuỗi được thực hiện cho bmp3 dựa trên các
chuỗi protein được tạo ra. Chỉ những axit amin thay thế riêng có tính đa hình
hoặc cố định ở cá ngựa gai mới được thu hồi. Sự thay thế riêng tư, đa hình đề
cập đến sự thay thế axit amin được phân tách riêng ở một hoặc nhiều trong số
bốn loài cá ngựa gai, trong khi các trạm biến áp cố định, riêng tư đề cập đến sự
thay thế axit amin được cố định riêng ở một hoặc nhiều trong số bốn loài cá
ngựa gai.
Việc lai toàn bộ tại chỗ của bmp3 đã được thực hiện với phôi của cá ngựa lót
lông H. erectus ở các giai đoạn phát triển khác nhau, bao gồm khoảng bốn, ba,
hai và một ngày trước khi sinh (đối với giai đoạn sau, ba lần sao chép độc lập đã
được thực hiện trùng khớp với nhau). mẫu biểu thức).
Phôi được mổ xẻ trong dung dịch muối đệm 1X không chứa RNase và cố định
trong 4% paraformaldehyde (PFA) ở 4°C qua đêm. Đối với bmp3, một đầu dò
RNA antisense cụ thể đã được tổng hợp: các UTP được gắn nhãn digoxigenin
(Roche, item-nr. 11277073910) và SP6 RNA Polymerase (Roche, item-nr.
RPOLSP6-RO) được sử dụng để tổng hợp các đầu dò RNA antisense từ các
plasmid trong đó một đoạn PCR bmp3 đã được nhân bản sau chất kích thích SP6
RNA Polymerase (Bảng bổ sung 11). Các quy trình lai hầu hết tuân theo các quy
trình được mô tả trước đây: đầu tiên, phôi được tẩy trắng và làm sạch trong
1,5% H2O2 trong 1% KOH cho đến khi loại bỏ sắc tố (chỉ được thực hiện đối
với mẫu được trình bày trong Hình 4), sau đó được làm thấm bằng cách sử dụng
10 μg/ml proteinase K. trong dung dịch muối Tris-đệm 0,1% Tween-20 (TBS-T)
trong 15-20
phút, sau đó hoạt tính phosphatase kiềm nội sinh (AP) bị vô hiệu hóa bằng dung
dịch trietanolamine 0,2 M (pH 7,5) với 2,5% anhydrit axetic được thêm trực tiếp
trước khi xử lý (trong 20 phút) và quá trình tái cố định sử dụng 4% PFA trong
20 phút đã được thực hiện . Ở giữa các bước, quá trình rửa được thực hiện bằng
TBS-T. Sau đó, các mẫu được cân bằng với hỗn hợp lai ở 68°C trong 4 giờ, tiếp
theo là lai qua đêm bằng hỗn hợp lai với đầu dò 100 ng/ml ở 68°C. Sau đó, các
mẫu được rửa nhiều lần bằng cách sử dụng hỗn hợp từ muối natri citrat 5x
(SSC), 50% formamide và 2% Tween-20 ở 68°C, sau đó rửa trong 2x SSC với
0,2% Tween-20 ở nhiệt độ phòng. Sau khi rửa bằng TBS-T, các mẫu được chặn
bằng cách sử dụng đệm chặn trong 1,5 giờ, sau đó được xử lý bằng kháng thể
kháng DIG-AP (nồng độ 1:4000; Roche, item-nr. 11093274910) trong đệm chặn
trong 5 giờ tại phòng nhiệt độ. Sau khi rửa mẫu nhiều lần trong 2 ngày bằng
dung dịch đệm axit maleic, chúng được giữ trong dung dịch đệm AP (với
Levamisol) trong 20 phút, sau đó chúng được chuyển sang BM-Purple cho đến
khi đạt được cường độ màu mong muốn (Roche, item-nr. 11442074001 ) và cuối
cùng được chụp ảnh.
Để nghiên cứu các hậu quả về kiểu hình của việc mất bmp3 trong teleost, chúng
tôi đã sử dụng chiến lược CRISPR/Cas9 để tạo ra dòng cá ngựa vằn đột biến
bmp3 theo Miguel et al. RNA hướng dẫn bmp3 (gRNA) được thiết kế trực tuyến
(//www.crisprscan.org/?page=gene) nhắm mục tiêu exon đầu tiên của bmp3 cá
ngựa vằn. Các gRNA được xây dựng bằng phương pháp PCR chồng chéo.
Phương pháp này yêu cầu một oligo DNA đặc hiệu đích (oligo chuỗi trên cùng)
và một oligo DNA chung cho RNA dẫn hướng (Bảng bổ sung 11). Oligo đặc
hiệu đích chứa trình tự khởi đầu T7, trình tự đích và cuối cùng là trình tự 20-nt
bổ sung cho RNA dẫn hướng (Bảng bổ sung 11). Hai oligos được ủ và mở rộng
bằng DNA
polymerase và sản phẩm thu được đóng vai trò là khuôn mẫu để sao chép in
vitro bằng cách sử dụng Bộ phiên mã mMESSAGE mMACHINE™ T7
(Thermo Fischer Scientific AM1344) và quá trình sản xuất bản phiên mã được
tinh chế bằng RNA Clean & Concentrator™-5 (Zymo Research R1014). Vector
pT3TS-nCas9n được tổng hợp bằng enzyme giới hạn XbaI (NEB R0145S) và
được thực hiện
sao chép và tinh chế in vitro bằng cách sử dụng Bộ phiên mã mMESSAGE
mMACHINE™ T3 (Thermo Fischer Scientific AM1348).
Cá ngựa vằn biến đổi gen bố mẹ được đánh dấu protein huỳnh quang màu xanh
lá cây cho yếu tố phiên mã đặc hiệu nguyên bào xương (Osterix GFP) được sử
dụng trong thí nghiệm này được nuôi ở nhiệt độ 26–28 °C trong chu kỳ ánh sáng
được kiểm soát (14 giờ sáng, 10 giờ tối) để kích thích sinh sản. Các sgRNA tinh
khiết (80 ng/μl) được tiêm đồng thời với Cas9 mRNA (400 ng/μl) vào phôi cá
ngựa vằn ở giai đoạn một tế bào. Những con cá sáng lập (F0) này được nuôi đến
trưởng thành và các đoạn mồi xác định kiểu gen (Bảng bổ sung 11) được sử
dụng để sàng lọc F0 có đột biến vị trí bằng cách cắt vây, tách DNA, PCR bao
trùm vị trí mục tiêu và giải trình tự. F0 trưởng thành có đột biến được lai với cá
hoang dã để thu được cá F1, sau đó được xác định kiểu gen. Các cá F1 có cùng
kiểu gen đột biến truyền đột biến dịch khung được lai cận huyết để thu được cá
F2 đồng hợp tử, chúng được sử dụng để quan sát kiểu hình sâu hơn. Các mẫu
vật hoang dã và đột biến được dán nhãn Osterix GFP đã được quan sát và chụp
ảnh dưới Kính hiển vi soi nổi huỳnh quang Leica M205 FA (Wetzlar, Đức). Tất
cả các thí nghiệm được thực hiện theo các quy trình của Ủy ban Chăm sóc và Sử
dụng Động vật Thể chế đã được phê duyệt của ủy ban đạo đức khoa học của Đại
học Nông nghiệp Huazhong (HZAUFI-2018-018)
Kết quả là chúng tôi không quan sát thấy đột biến alen đối với dre-bmp3-
gRNA1, do đó không có dòng ổn định nào được tạo ra cho CRISPR này. Nhưng
đối với dre-bmp3-gRNA2, hai alen vô nghĩa bmp3 có 14 bp chèn (bmp3+14) và
xóa 2 bp (bmp3−2) trong exon đầu tiên
đã được tạo ra (Hình bổ sung 12b), cả hai đều gây ra đột biến dịch khung ở AA
thứ 69 và sự kiện chấm dứt phiên mã sớm ở AA thứ 161 và 94, tương ứng. Ở cá
bmp3 đột biến F2, chúng tôi quan sát thấy một loạt khiếm khuyết ở vảy, chẳng
hạn như sự giảm số lượng vảy, sự sắp xếp lại và hình dạng không đều.
Cá đột biến F2 bmp3+14 cho 4/29 cá bị khiếm khuyết vảy trong khi 3/31 cá bị
khiếm khuyết vảy đối với cá đột biến F2 bmp3−2.

Báo cáo tóm tắt. Thông tin thêm về thiết kế nghiên cứu có sẵn trong Tóm tắt
Báo cáo Nghiên cứu Tự nhiên được liên kết với bài viết này

You might also like