Khung hấp dẫn trung bình của Thuyết Sợi Năng Lượng (Energy Filament Theory, EFT), so sánh với đường cơ sở NFW tối thiểu cho vật chất tối lạnh (DM)
0 Tóm tắt điều hành (Executive Summary)
Báo cáo này là bản báo cáo đầy đủ cấp xuất bản đã lưu trữ trên Zenodo (ấn bản lưu trữ). Nó cung cấp một chuỗi kiểm toán tích hợp, đi từ dữ liệu, sổ cái mô hình, so sánh công bằng, kiểm định khép kín cho đến vật liệu tái lập. Phụ lục B (P1A) đóng vai trò bổ sung về độ vững: phần này tập trung vào phép thử áp lực “mốc nền DM chuẩn hơn + sai số hệ thống then chốt”, nhằm kiểm tra mức nhạy của các kết luận chính trong bài đối với mô hình DM thực tế hơn và cách xử lý sai số hệ thống trong thấu kính hấp dẫn.
Kết luận cốt lõi (bốn câu có thể trích dẫn trực tiếp; xem chi tiết ở Mục 2.4):
(1) Trong phép khớp đường cong quay (RC), họ mô hình EFT vượt trội rõ rệt so với DM_RAZOR ở mọi tổ hợp hàm nhân/tiên nghiệm; mức cải thiện điển hình là Δlog𝓛_RC ≈ 10^3 (xem Bảng S1a).
(2) Trong kiểm định khép kín RC→GGL, EFT cho thấy khả năng chuyển giao xuyên đầu dò mạnh hơn: cường độ khép kín Δlog𝓛_closure (True−Perm) cao hơn đáng kể so với DM_RAZOR, và khác biệt này vẫn vững trước các quét covariance shrinkage, R_min và σ_int (xem Hình S3, Bảng S1b).
(3) Trong phép khớp liên hợp (RC+GGL), EFT vẫn giữ lợi thế ổn định; trong đối chứng âm (phá vỡ ánh xạ dùng chung), lợi thế này sụp xuống. Điều đó ủng hộ cách hiểu rằng “hiệu ứng hấp dẫn trung bình” đến từ ánh xạ dùng chung, chứ không phải từ sự khớp ngẫu nhiên (xem Hình S4).
(4) Phụ lục B (P1A), trong khi không làm tăng đáng kể số chiều, dùng các mô-đun mốc nền DM chuẩn hơn cùng một tham số nhiễu then chốt của sai số hệ thống thấu kính để thử áp lực phía DM; các phần tăng cường này không xóa bỏ lợi thế khép kín của EFT (xem Bảng B1, Hình B1).
Khả dụng dữ liệu và mã: báo cáo Concept DOI 10.5281/zenodo.18526334; gói tái lập đầy đủ Concept DOI 10.5281/zenodo.18526286. Các nhãn tương ứng với Phụ lục B (P1A) là run_tag=20260213_151233, closure_tag=20260213_161731, joint_tag=20260213_195428.
1 Tóm tắt
Chúng tôi thực hiện một so sánh định lượng có thể tái lập giữa hai khung lý thuyết trên cùng bộ dữ liệu và cùng giao thức thống kê: mô hình “hiệu chỉnh hấp dẫn trung bình” do Thuyết Sợi Năng Lượng (Energy Filament Theory, EFT; không đồng nghĩa với cách viết tắt phổ biến Effective Field Theory) đề xuất, và mô hình halo NFW làm mốc nền cho vật chất tối lạnh (DM_RAZOR). DM_RAZOR được cố ý chọn làm “mốc nền DM tối thiểu”: halo NFW + quan hệ c–M cố định (không có scatter giữa các halo), để tạo một đối chứng có thể kiểm toán và kiểm tra lại. Đồng thời cần nhấn mạnh rằng trong bài này, EFT được xem như một tham số hóa hiện tượng luận, kiểu MOND, của Trường hiệu dụng/đáp ứng hiệu dụng để kiểm nghiệm trong một giao thức thống kê thống nhất, chứ không được suy ra ở đây từ các nguyên lý vi mô bậc nhất.
Dữ liệu bao gồm: 2295 điểm dữ liệu vận tốc từ các đường cong quay SPARC (RC) sau tiền xử lý và phân bin thống nhất (104 thiên hà, 20 RC-bin), cùng mật độ mặt tương đương ΔΣ(R) từ thấu kính hấp dẫn yếu thiên hà-thiên hà KiDS-1000 (GGL) (4 bin khối lượng sao × 15 điểm R cho mỗi bin, tổng cộng 60 điểm, dùng đầy đủ ma trận hiệp phương sai).
Chúng tôi lần lượt thực hiện suy luận RC-only, kiểm định khép kín RC→GGL (closure), suy luận GGL-only và suy luận liên hợp RC+GGL; đồng thời dùng kiểm toán nhất quán để bảo đảm mọi số liệu được trích dẫn đều có thể truy ngược. Dưới các ràng buộc nghiêm ngặt về sổ cái tham số và ánh xạ dùng chung (DM: 20 log M200_bin; EFT: 20 log V0_bin + 1 log ℓ toàn cục), họ mô hình EFT vượt trội rõ rệt so với DM_RAZOR trong phép khớp liên hợp: ΔlogL_total = 1155-1337 (so với DM_RAZOR). Quan trọng hơn, kiểm định khép kín cho thấy hậu nghiệm RC có năng lực dự báo không tầm thường đối với GGL: cường độ khép kín của EFT là ΔlogL_closure = 172-281, cao hơn giá trị 127 của DM_RAZOR; khi xáo trộn ngẫu nhiên nhóm RC-bin→GGL-bin, tín hiệu khép kín sụp xuống còn 6-23, xác nhận tín hiệu này không phải ngẫu nhiên thống kê hay thiên lệch triển khai. Trong các quét hệ thống theo σ_int, R_min và covariance shrinkage, lợi thế tương đối của EFT vẫn dương và có bậc độ lớn ổn định. Để đáp lại các chất vấn thường gặp như “mốc nền DM quá yếu” hoặc “sai số hệ thống bị đọc thành vật lý”, chúng tôi đưa vào Phụ lục B (P1A) một phép thử áp lực với mốc nền DM chuẩn hơn nhưng vẫn ít chiều và có thể kiểm toán (bao gồm hierarchical c–M scatter + prior, đại diện core một tham số, lensing m và mô hình gộp DM_STD). Dưới cùng giao thức khép kín, các phần tăng cường này không xóa bỏ lợi thế khép kín của EFT (xem Bảng B1 / Hình B1).
Từ khóa: đường cong quay; thấu kính hấp dẫn yếu thiên hà-thiên hà; kiểm định khép kín; EFT; vật chất tối lạnh; suy luận Bayes
2 Dẫn nhập và tổng quan kết quả
Đường cong quay (RC) và thấu kính hấp dẫn yếu thiên hà-thiên hà (GGL) là hai đầu dò hấp dẫn bổ sung cho nhau: RC ràng buộc thế động lực trong mặt phẳng đĩa và quan hệ gia tốc xuyên tâm (RAR), còn GGL đo phân bố khối lượng chiếu và đáp ứng hấp dẫn ở thang halo. Với bất kỳ lý thuyết ứng viên nào, điểm then chốt không phải là liệu nó có thể khớp riêng từng bộ dữ liệu hay không, mà là liệu nó có thể đưa ra một lời giải thích nhất quán dưới cùng một ánh xạ xuyên dữ liệu và các ràng buộc dùng chung hay không.
Vì vậy, bài viết lấy “kiểm định khép kín” (closure test) làm giao thức thống kê trung tâm: trước hết dùng hậu nghiệm RC-only để dự báo tiến GGL, sau đó so sánh với đối chứng âm trong đó ánh xạ RC-bin→GGL-bin bị hoán vị/xáo trộn (permutation / shuffle). Mục đích là đánh giá khả năng chuyển giao dự báo xuyên dữ liệu (predictive transferability), đồng thời loại trừ tín hiệu giả do thiên lệch triển khai hoặc khớp ngẫu nhiên.
Định vị lý thuyết và phạm vi: bài viết này không cố gắng trình bày trong bản thảo hiện tại suy dẫn vi mô từ các nguyên lý bậc nhất của EFT (Thuyết Sợi Năng Lượng), cũng không đưa ra một dạng tương đối luận hoàn chỉnh. Ngược lại, chúng tôi xem EFT như một tham số hóa ít chiều, kiểu MOND, của trường hiệu dụng/đáp ứng hiệu dụng (được mô tả bằng hàm nhân f(x) và thang toàn cục ℓ), rồi kiểm tra tính nhất quán xuyên dữ liệu và năng lực dự báo có thể chuyển giao của nó bằng kiểm định khép kín RC→GGL dưới sổ cái tham số nghiêm ngặt.
Kế hoạch nghiên cứu và tuyên bố phạm vi: bài viết này thuộc một chương trình truy tìm quan sát P-series đang tiếp diễn. Trong dữ liệu thang thiên hà hiện có, chúng tôi tìm hai dạng đóng góp nền hiệu dụng có thể tồn tại: (i) “nền hấp dẫn” (mean gravity floor) có thể mô tả bằng đáp ứng hấp dẫn trung bình sau làm thô; và (ii) “nền nhiễu” (stochastic/noise floor) liên quan đến dao động của các quá trình vi mô. Trong bài này (P1), chúng tôi chỉ tập trung vào dạng thứ nhất: không đưa vào giả thiết về bất kỳ cơ chế sinh vi mô cụ thể nào, mà truy tìm dấu vết quan sát của nền hấp dẫn trung bình bằng kiểm định khép kín RC→GGL và so sánh với mốc nền DM có thể kiểm toán trong một giao thức đối chứng thống nhất. Như một hình ảnh vật lý gợi ý, nếu tồn tại các bậc tự do ngắn hạn, thì phân rã/hủy cặp của chúng có thể chuyển khối lượng nghỉ thành năng lượng-động lượng do các bậc tự do khác mang, và ở mức hiệu dụng điều này tự nhiên tương ứng với phân tách “đóng góp trung bình + đóng góp dao động”. Tuy nhiên, bài viết không mô hình hóa định lượng hình ảnh vi mô này.
Để tránh diễn giải quá mức, ranh giới phạm vi của bài viết như sau:
• Bài viết làm gì: dưới sổ cái tham số nghiêm ngặt và ràng buộc ánh xạ dùng chung, dùng kiểm định khép kín để đo khả năng chuyển giao dự báo xuyên dữ liệu, đồng thời so sánh có thể tái lập giữa đáp ứng hấp dẫn trung bình EFT và mốc nền DM.
• Bài viết không làm gì: không thảo luận bất kỳ cơ chế sinh vi mô, độ phong phú/thời gian sống hay ràng buộc vũ trụ học nào; không mô hình hóa hạng ngẫu nhiên tương ứng với “nền nhiễu”.
• Bài viết không tuyên bố gì: không nhằm lật đổ vật chất tối; P1 không đưa ra phán quyết cuối cùng về câu hỏi “nền có tồn tại hay không”, mà chỉ báo cáo bằng chứng giai đoạn: trong miền đo vững được chọn trong bài, dữ liệu thiên về mô hình có chứa đáp ứng hấp dẫn trung bình.
Đồng thời, chúng tôi nêu rõ rằng DM_RAZOR chỉ đại diện cho một mốc nền NFW tối thiểu và có thể kiểm toán (c–M cố định, không có scatter; không bao gồm co rút đoạn nhiệt Adiabatic Contraction, feedback core, phi cầu hay hạng môi trường). Vì vậy, kết luận chính trong phần thân bài được giới hạn nghiêm ngặt như sau: dưới mốc nền tối thiểu này và các ràng buộc nghiêm ngặt về sổ cái tham số/ánh xạ, tính nhất quán xuyên dữ liệu của EFT mạnh hơn. Để trả lời một câu hỏi thường gặp - liệu mốc nền ΛCDM chuẩn hơn và việc mô hình hóa sai số hệ thống then chốt của thấu kính có làm thay đổi đáng kể kết luận hay không - chúng tôi gom các phần tăng cường DM chuẩn hơn nhưng vẫn ít chiều, có thể kiểm toán, cùng tham số nhiễu ở đầu thấu kính vào Phụ lục B (P1A: phép thử áp lực chuẩn hóa mốc nền DM), và giữ đúng cùng quy ước ánh xạ dùng chung cùng kiểm định khép kín như phần thân bài (xem Bảng B1 / Hình B1).
2.1 Tab S1a-S1b: Tổng hợp các chỉ báo then chốt (Strict)
Bảng S1a trình bày các chỉ báo so sánh chính của phép khớp liên hợp (RC+GGL: logL, ΔlogL, AICc, BIC); Bảng S1b trình bày các chỉ báo kiểm định khép kín và quét độ vững (closure, đối chứng âm shuffle, phạm vi quét σ_int / R_min / cov-shrink). Tất cả số liệu đều lấy từ bảng tổng hợp nghiêm ngặt Tab_Z1_master_summary và có thể truy ngược từng mục trong gói lưu trữ phát hành.
Bảng S1a | Các chỉ báo so sánh chính của phép khớp liên hợp (RC+GGL, Strict).
Workspace | W kernel | k | jointlogL_total | ΔlogLvs DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Bảng S1b | Các chỉ báo khép kín và độ vững (Strict).
Mô hình (workspace) | ΔlogL khép kín (true-perm) | ΔlogL sau đối chứng âm shuffle | Phạm vi ΔlogL khi quét σ_int | Phạm vi ΔlogL khi quét R_min | Phạm vi ΔlogL khi quét cov-shrink |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
2.2 Hình S3: Cường độ khép kín (RC-only → dự báo GGL)
Cường độ khép kín được định nghĩa là ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: dự báo tiến GGL trên các mẫu hậu nghiệm RC-only, rồi so sánh với đối chứng âm “hoán vị ánh xạ RC-bin→GGL-bin”.

Hình S3 | Cường độ khép kín (càng lớn càng tốt): lợi thế log-likelihood trung bình của dự báo RC-only → GGL.
2.3 Hình S4: So sánh chính của phép khớp liên hợp (RC+GGL)
Lợi thế khớp liên hợp được định nghĩa là ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Trên cùng dữ liệu, cùng ánh xạ và quy mô tham số gần như giống nhau, họ mô hình EFT đạt log-likelihood liên hợp cao hơn rõ rệt.

Hình S4 | Lợi thế khớp liên hợp (càng lớn càng tốt): best logL_total của RC+GGL so với DM_RAZOR.
2.4 Bốn câu kết luận (có thể trích dẫn trực tiếp)
(1) Trong phân tích liên hợp thống nhất giữa đường cong quay SPARC và thấu kính hấp dẫn yếu KiDS-1000, các mô hình thuộc khung hấp dẫn trung bình EFT vượt trội có hệ thống so với DM_RAZOR dưới giao thức đối chứng nghiêm ngặt: ΔlogL_total = 1155-1337 (so với DM_RAZOR).
(2) Kiểm định khép kín RC→GGL cho thấy tính nhất quán dự báo của EFT mạnh hơn: ΔlogL_closure = 172-281, trong khi DM_RAZOR là 127; sau khi xáo trộn ngẫu nhiên nhóm RC-bin→GGL-bin, tín hiệu khép kín sụp xuống còn 6-23, cho thấy tín hiệu phụ thuộc vào ánh xạ xuyên dữ liệu đúng chứ không phải khớp ngẫu nhiên.
(3) Các quét hệ thống theo σ_int, R_min và covariance shrinkage đều không làm đổi dấu hay bậc độ lớn của kết luận “EFT tốt hơn DM_RAZOR”, cho thấy kết luận này vững trước các nhiễu hệ thống thường gặp.
(4) Phụ lục B (P1A) tăng cường mốc nền DM theo cách “chuẩn hóa và có thể kiểm toán” dưới cùng giao thức khép kín: giữ ba nhánh tăng cường một tham số (SCAT/AC/FB), đồng thời thêm hierarchical c–M scatter + prior, đại diện core một tham số và hiệu chuẩn shear m ở đầu thấu kính (cùng tổ hợp DM_STD). Kết quả cho thấy chỉ nhánh feedback/core đem lại cải thiện ròng nhỏ về cường độ khép kín (122.21→129.45, ΔΔlogL_closure≈+7.25); các tăng cường còn lại không loại bỏ lợi thế khép kín của EFT. Vì vậy, ưu thế của EFT không đơn giản đến từ việc mốc nền DM trong thân bài “quá yếu”.
3 Dữ liệu và tiền xử lý
Nghiên cứu này sử dụng hai loại dữ liệu công khai và hoàn tất tải xuống, kiểm tra (sha256) cùng tiền xử lý bằng các script có thể truy vết trong phần kỹ thuật. Để bảo đảm so sánh công bằng giữa các mô hình, tất cả workspace (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) dùng chung hoàn toàn cùng sản phẩm dữ liệu và cùng ánh xạ phân bin.
3.1 Đường cong quay (RC, SPARC)
Dữ liệu RC lấy từ Rotmod_LTG của cơ sở dữ liệu SPARC (175 tệp rotmod). Sau tiền xử lý, mẫu được đưa vào mô hình hóa trong dự án gồm 104 thiên hà, tổng cộng 2295 điểm dữ liệu (r, V_obs), và được chia thành 20 RC-bin theo khối lượng sao cùng các quy tắc khác. Mỗi điểm dữ liệu bao gồm bán kính r (kpc), vận tốc quan sát V_obs (km/s) và sai số σ_obs, cùng vận tốc thành phần khí/đĩa/phồng sao (V_gas, V_disk, V_bul).
3.2 Thấu kính hấp dẫn yếu (GGL, KiDS-1000 / Brouwer+2021)
Dữ liệu GGL sử dụng mật độ mặt tương đương ΔΣ(R) trong Hình 3 của Brouwer và cộng sự (2021) trên KiDS-1000 (4 bin khối lượng sao, mỗi bin 15 điểm R), đồng thời dùng ma trận hiệp phương sai đầy đủ mà họ cung cấp. Trong phần kỹ thuật, ma trận hiệp phương sai dạng long-form ban đầu được dựng lại thành ma trận 15×15 cho từng bin; kiểm toán Stage-B xác nhận kích thước và giá trị là hợp lý.
3.3 Ánh xạ RC-bin → GGL-bin và tổng cỡ mẫu
4 bin khối lượng của GGL được nối với 20 bin của RC bằng một ánh xạ cố định: mỗi GGL-bin tương ứng với 5 RC-bin, và đóng góp của các RC-bin được lấy trung bình có trọng số theo số thiên hà. Ánh xạ này được giữ nguyên trong mọi mô hình, là ràng buộc cốt lõi bảo đảm so sánh công bằng trong kiểm định khép kín và phép khớp liên hợp. Tổng số điểm dữ liệu cuối cùng là n_total = 2355 (RC=2295, GGL=60).
4 Mô hình và phương pháp thống kê
4.1 Quy phạm toán học tối thiểu của EFT và DM (có thể kiểm toán/kiểm nghiệm)
Mục này đưa ra quy phạm toán học tối thiểu có thể đối chiếu trực tiếp với triển khai.
(a) Mô hình đường cong quay (RC)
Với mỗi điểm dữ liệu RC (r, V_obs, σ_obs), chúng tôi dùng phép cộng chồng thành phần: V_mod²(r) = V_bar²(r) + V_extra²(r). Trong đó V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Trong các kết quả chính của bản thảo này, chúng tôi dùng Υ_d = Υ_b = 0.5 (phù hợp với khuyến nghị kinh nghiệm của SPARC và cũng giúp giảm bớt các bậc tự do không cần thiết).
(b) Hiệu chỉnh hấp dẫn trung bình EFT (EFT)
Hạng phụ trội của EFT được tham số hóa dưới dạng “bình phương vận tốc trung bình”: V_extra²(r) = V0_bin² · f(r/ℓ). Ở đây V0_bin là tham số biên độ của từng RC-bin (20 tham số), ℓ là thang toàn cục (1 tham số), và f(x) là hàm dạng nhân không thứ nguyên. Các dạng nhân được so sánh trong bài (đều không thêm bậc tự do liên tục) là:
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (đối chứng tùy chọn) gaussian: f(x)=erf(x/√2) (không đưa vào tập kết luận chính)
Động cơ vật lý (mở rộng): EFT hiểu đáp ứng hấp dẫn phụ trội ở thang thiên hà như một đáp ứng hiệu dụng sau làm thô/lấy trung bình theo thang của các tác dụng vi mô hơn trên phạm vi hữu hạn. Trong bài này, chúng tôi không giả định trước một cơ chế vi mô cụ thể nào, mà dùng một tham số hóa tối thiểu, có thể kiểm toán, để tiến hành so sánh và kiểm nghiệm có kiểm soát dưới giao thức thống kê thống nhất.
Để dễ hình dung, có thể viết hạng phụ trội dưới dạng gia tốc: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Khi r≫ℓ, f→1 và V_extra→V0_bin, từ đó cho đóng góp vận tốc phụ trội gần phẳng ở vùng ngoài; khi r≪ℓ và f(x)≈x, có thể đưa vào một thang gia tốc đặc trưng a0,bin≈V0_bin²/ℓ (sai khác một hệ số nhân O(1) do hàm nhân), cung cấp trực giác về thang chuyển tiếp trong-ngoài kiểu MOND.
Họ nhân rời rạc dùng trong bài (none/exponential/yukawa/powerlaw_tail) có thể xem là các proxy ít chiều cho các lựa chọn khác nhau về “độ dốc ban đầu/tốc độ chuyển tiếp/đuôi dài hạn” (ví dụ đáp ứng bị chắn kiểu Yukawa so với đáp ứng có đuôi dài hơn). Chúng được dùng cho thử áp lực độ vững, chứ không nhằm vét cạn không gian mô hình. Ở phần thấu kính yếu, chúng tôi xây dựng khối lượng bao và mật độ hiệu dụng từ V_avg(r), rồi chiếu để thu được ΔΣ(R). Mật độ hiệu dụng này nên được hiểu là mô tả hiệu dụng của thế thấu kính dưới giả định đối xứng cầu và trường yếu, chứ không phải một phát biểu về phân bố vật chất tối hạt ở cấp vi mô.
Tất cả các dạng nhân trên đều thỏa f(x)→1 khi x→∞ (tức V_extra²→V0² bão hòa), còn khi x≪1 chúng cho tăng trưởng tuyến tính hoặc dưới tuyến tính: ví dụ exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Vì vậy, các dạng nhân khác nhau có khác biệt quan sát được ở “độ dốc ban đầu”, tốc độ chuyển tiếp và đuôi ngoài, có thể phân biệt bằng phép khớp liên hợp và kiểm định khép kín RC+GGL.
Dự báo EFT cho thấu kính yếu ΔΣ(R) được suy ngược từ V_avg(r) để xây dựng khối lượng bao và mật độ, rồi chiếu tích phân: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). Triển khai số dùng lưới logarit và tự thích nghi làm dày lưới khi có bất thường, nhằm bảo đảm ổn định và khả năng lặp lại.
(c) DM_RAZOR: mốc nền halo vật chất tối lạnh NFW
Đồng thời, chúng tôi nêu rõ rằng DM_RAZOR chỉ đại diện cho mốc nền NFW tối thiểu, có thể kiểm toán (c–M cố định và không có scatter; không bao gồm Adiabatic Contraction, feedback core, phi cầu hay hạng môi trường). Để giảm rủi ro “strawman baseline”, bài viết không khẳng định các hiệu ứng đó không tồn tại; ngược lại, chúng được đưa vào Phụ lục B (P1A) theo cách ít chiều và có thể kiểm toán như phép thử áp lực: bao gồm xử lý tầng bậc cho c–M scatter, core proxy, lensing m cùng tổ hợp DM_STD.
4.2 Sổ cái mô hình và so sánh công bằng (tham số dùng chung = định nghĩa khép kín)
Số lượng tham số của tập so sánh chính là: DM_RAZOR k=20; họ EFT k=21 (thêm 1 tham số là log ℓ toàn cục). Mọi mô hình dùng chung cùng dữ liệu RC, cùng dữ liệu GGL và hiệp phương sai, cùng ánh xạ RC-bin→GGL-bin, cùng hạng baryon và cùng chuyển đổi đơn vị. Ngoài ra, dạng nhân (none / exponential / yukawa / powerlaw_tail) là lựa chọn rời rạc, không đưa thêm tham số liên tục, nhờ đó tránh việc đạt lợi thế chỉ vì “nhiều hơn một bậc tự do”.
4.3 Likelihood, tiên nghiệm và bộ lấy mẫu
Likelihood của RC dùng Gaussian đường chéo: σ_eff² = σ_obs² + σ_int²; kết quả chính cố định σ_int=5 km/s và quét σ_int trong Run-5. Likelihood của GGL dùng Gaussian với hiệp phương sai đầy đủ theo từng bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Mục tiêu liên hợp là logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Các tiên nghiệm chính đại diện cho biên khả dụng vật lý (ràng buộc khoảng cho log ℓ, log V0 và log M200); khi bật Υ và σ_int tự do, dùng tiên nghiệm thông tin yếu (chi tiết nằm trong triển khai và cấu hình gói release).
Bộ lấy mẫu là random walk Metropolis theo block thích nghi: mỗi bước chỉ cập nhật một khối con ngẫu nhiên trong không gian tham số để tăng tỷ lệ chấp nhận ở chiều cao, đồng thời điều chỉnh nhẹ bước nhảy theo tỷ lệ chấp nhận trong cửa sổ (tỷ lệ mục tiêu khoảng 0.25). Kết quả chính dùng chế độ quick (n_steps=800 và các thiết lập tương tự), và mỗi workspace xuất trace, phần dư cùng đồ thị PPC để kiểm toán bằng mắt và bằng script.
4.4 Kiểm định khép kín và đối chứng âm (định nghĩa)
Kiểm định khép kín (Run-2) kiểm tra câu hỏi “hậu nghiệm RC-only có dự báo được GGL không” mà không khớp lại GGL. Cụ thể, trên các mẫu hậu nghiệm RC-only, ta sinh tiến ΔΣ(R) cho 4 GGL-bin rồi tính logL_true bằng hiệp phương sai đầy đủ; sau đó hoán vị ngẫu nhiên ánh xạ nhóm RC-bin→GGL-bin để thu logL_perm. Cường độ khép kín được định nghĩa là ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Ngoài ra, Run-10 gom lại ngẫu nhiên 20 RC-bin thành 4×5 (shuffle) và tính lại độ khép kín; thao tác này kiểm tra mức phụ thuộc của tín hiệu khép kín vào ánh xạ đúng.
5 Kết quả chính và diễn giải
5.1 Kết quả chính của phép khớp liên hợp (RC+GGL)
Best logL_total của phép khớp liên hợp và lợi thế tương đối ΔlogL_total (so với DM_RAZOR) được trình bày trong Bảng S1a và Hình S4. Trong tập so sánh chính, EFT_BIN đạt lợi thế liên hợp lớn nhất (ΔlogL_total=1337.210), còn các dạng nhân EFT khác cũng giữ lợi thế rõ rệt (1154.827-1294.442). Theo các tiêu chí thông tin (AICc/BIC), họ EFT cũng vượt trội rõ rệt so với DM_RAZOR, cho thấy lợi thế không đến từ thiên lệch do số lượng tham số.
Ghi chú: đóng góp chính của ΔlogL_total≈1337 đến từ hạng RC (trong phân rã joint, ΔlogL_RC≈1065, chiếm khoảng 80%). Có thể hiểu điều này như sau: với N=2295 điểm dữ liệu RC, cải thiện vừa phải ở mức Δχ²≈0.90 trên mỗi điểm tích lũy tự nhiên thành lợi thế bậc 10^3 trong likelihood Gaussian đường chéo. Trong khi đó, GGL và kiểm định khép kín cung cấp ràng buộc độc lập xuyên dữ liệu, và thứ hạng vẫn ổn định dưới các thử áp lực σ_int, R_min và cov-shrink (xem Mục 6 và Bảng S1b).
5.2 Kết quả kiểm định khép kín (RC-only → GGL)
Đại lượng then chốt của kiểm định khép kín, ΔlogL_closure, được trình bày trong Bảng S1b và Hình S3. Cường độ khép kín của họ EFT là 171.977-280.513, cao hơn 126.678 của DM_RAZOR. Điều này có nghĩa là khi không cho phép thêm bất kỳ bậc tự do xuyên dữ liệu nào, các mẫu hậu nghiệm mà EFT thu được từ dữ liệu RC có năng lực dự báo có thể chuyển giao mạnh hơn đối với dữ liệu GGL.
Đối chứng âm tiếp tục ủng hộ ý nghĩa vật lý của tín hiệu khép kín: khi xáo trộn ngẫu nhiên nhóm RC-bin→GGL-bin, cường độ khép kín của EFT giảm xuống 6-15 (khác nhau nhẹ theo dạng nhân), trong khi cường độ khép kín ở ánh xạ gốc là 172-281. Sự “sụp tín hiệu” này loại trừ lợi thế giả do triển khai số, lỗi đơn vị hoặc xử lý hiệp phương sai sai.

Hình R1 | Đối chứng âm: tín hiệu khép kín giảm rõ rệt sau khi shuffle nhóm (vẽ từ chỉ báo Tab_Z1).
5.3 Ý nghĩa và giới hạn của kết quả
Kết luận của nghiên cứu này là: “trên bộ dữ liệu và giao thức này, hiệu chỉnh hấp dẫn trung bình EFT tốt hơn mốc nền DM_RAZOR được kiểm tra”. Cần nhấn mạnh rằng phía DM chỉ dùng mốc nền NFW tối thiểu và quan hệ c(M) cố định, chưa đưa vào chẳng hạn core hóa, phi cầu, hạng môi trường hay mô hình liên kết thiên hà-halo phức tạp hơn. Vì vậy, bản thảo không tuyên bố loại trừ mọi họ mô hình DM; thay vào đó, nó cung cấp một mốc đối chứng có thể tái lập, đặt kiểm định khép kín ở trung tâm, để đánh giá câu hỏi “RC và GGL có thể được giải thích nhất quán bằng cùng một bộ tham số xuyên dữ liệu và cùng ánh xạ hay không”.
Để đáp lại chất vấn thường gặp này, chúng tôi đã hoàn tất một dự án mở rộng độc lập P1A (xem Phụ lục B). Không thay đổi ánh xạ dùng chung RC-bin→GGL-bin và khung kiểm toán, dự án này tăng cường mốc nền DM theo cách “chuẩn hóa và có thể kiểm toán”: ngoài ba nhánh tăng cường một tham số (SCAT/AC/FB), còn thêm (i) hierarchical c–M scatter + mass-concentration prior (DM_HIER_CMSCAT), (ii) baryonic-feedback core proxy một tham số (DM_CORE1P), và (iii) tham số nhiễu hiệu chuẩn shear m ở phía thấu kính yếu (DM_RAZOR_M); đồng thời đưa ra mô hình gộp DM_STD, còn EFT_BIN được giữ làm tham chiếu đối chứng.
• DM_RAZOR_SCAT (c–M scatter) - đưa vào tham số tán xạ nồng độ giữa các halo σ_logc, nhằm kiểm tra giả định “c(M) cố định” có đang đánh giá thấp một cách hệ thống năng lực giải thích của DM hay không;
• DM_RAZOR_AC (Adiabatic Contraction) - dùng một tham số α_AC để nội suy liên tục giữa “không co rút ↔ co rút chuẩn”, qua đó bắt được xu hướng co rút vùng trong do baryon gây ra với chi phí tối thiểu;
• DM_RAZOR_FB (Feedback / core) - mô tả tác động kìm hãm của core hóa vùng trong lên đường cong quay bằng một thang core (ví dụ log r_core), trong khi vẫn giữ xấp xỉ NFW ở thang thấu kính yếu.
Scoreboard định lượng của P1A được trình bày ở Phụ lục B, Bảng B1 / Hình B1 (tự động sinh từ Tab_S1_P1A_scoreboard). Trên chỉ báo khép kín, DM_RAZOR_FB cho cải thiện ròng nhỏ (122.21→129.45, +7.25); các tăng cường còn lại không đóng góp đáng kể hoặc đóng góp âm cho cường độ khép kín. Ở phía khớp liên hợp, việc thêm hierarchical c–M scatter prior (DM_HIER_CMSCAT) hoặc mô hình gộp (DM_STD) có thể cải thiện rõ rệt joint logL, nhưng không làm tăng cường độ khép kín; điều này gợi ý rằng phần lợi chủ yếu đến từ tính linh hoạt khi khớp liên hợp, chứ không phải từ khả năng chuyển giao xuyên đầu dò. Do đó, kết luận cốt lõi của thân bài nên được hiểu là: dưới ràng buộc ánh xạ dùng chung nghiêm ngặt và kiểm định khép kín, lợi thế nhất quán xuyên dữ liệu của EFT không bắt nguồn từ việc chọn “mốc nền quá yếu” cho phía DM. Gói phát hành P1A tương ứng trong Phụ lục B (bảng/hình bổ sung và full_fit_runpack) sẽ được đưa vào cùng Zenodo Concept DOI của full_fit_runpack trong bài này dưới dạng tệp bổ sung: https://doi.org/10.5281/zenodo.18526286.
6 Độ vững và thí nghiệm đối chứng
6.1 Quét σ_int (Run-5)
Chúng tôi quét hệ thống độ tán xạ nội tại σ_int của RC; với mỗi giá trị σ_int, lặp lại suy luận liên hợp và tính ΔlogL_total so với DM_RAZOR. Giá trị nhỏ nhất/lớn nhất của ΔlogL_total trong phạm vi quét cho từng mô hình được trình bày ở Bảng S1b.

Hình R2 | Phạm vi ΔlogL_total khi quét σ_int (càng lớn càng tốt).
6.2 Quét R_min (Run-6)
Để kiểm tra ảnh hưởng của sai số hệ thống ở vùng trung tâm (ví dụ chuyển động phi tròn, độ phân giải và mô hình baryon chưa đầy đủ), chúng tôi cắt dữ liệu RC theo ngưỡng R_min và lặp lại suy luận liên hợp. Lợi thế của họ EFT vẫn dương và ổn định về bậc độ lớn dưới quét R_min.

Hình R3 | Phạm vi ΔlogL_total khi quét R_min (càng lớn càng tốt).
6.3 Quét cov-shrink (Run-7)
Để kiểm tra bất định trong hiệp phương sai GGL, chúng tôi áp dụng shrinkage lên ma trận hiệp phương sai của từng bin khối lượng: C_α=(1−α)C+α·diag(C), rồi quét α. Kết quả cho thấy lợi thế của họ EFT không nhạy với cách xử lý này.

Hình R4 | Phạm vi ΔlogL_total khi quét cov-shrink (càng lớn càng tốt).
6.4 Thang bậc tiêu giảm (Run-8)
Bên trong EFT_BIN, chúng tôi thực hiện tiêu giảm lồng nhau: từ mô hình cực giản (không có tham số tự do), sang mô hình chỉ giữ một số ít bậc tự do, rồi đến mô hình đầy đủ với biên độ 20-bin + thang toàn cục. AICc/BIC cho thấy EFT_BIN đầy đủ là cần thiết một cách rõ rệt để giải thích dữ liệu.

Hình R5 | Thang bậc tiêu giảm của EFT_BIN (AICc; càng nhỏ càng tốt).
6.5 Dự báo giữ lại ngoài mẫu (Run-9)
Chúng tôi tiếp tục thực hiện kiểm định leave-one-bin-out (LOO): trong 4 bin khối lượng của GGL, mỗi lần giữ lại 1 bin làm ngoài mẫu; dùng các bin còn lại (cùng toàn bộ RC) để suy luận lại, rồi đánh giá log-likelihood kiểm tra trên bin được giữ lại. Chỉ báo tổng hợp nằm trong bảng bổ sung Tab_R3_leave_one_bin_out (sản phẩm Run-9; mẫu đường dẫn tệp được nêu ở danh sách sản phẩm then chốt trong Mục 8.2). Họ EFT vẫn vượt rõ rệt DM_RAZOR ngay cả trong tình huống giữ lại kém nhất.

Hình R6 | LOO: phân bố log-likelihood của bin được giữ lại (từ sản phẩm Run-9).
6.6 Đối chứng âm: shuffle RC-bin (Run-10)
Run-10 gom ngẫu nhiên 20 RC-bin thành 4×5 và, trong khi giữ nguyên hậu nghiệm RC-only, tính lại độ khép kín. Kết quả cho thấy so với ánh xạ gốc, shuffle làm giảm rõ rệt mean logL_true và ΔlogL_closure (xem Bảng S1b và Hình R1), qua đó tiếp tục ủng hộ tính có thể giải thích của tín hiệu khép kín.

Hình R7 | Đối chứng âm: ánh xạ shuffle làm mean logL_true của khép kín giảm rõ rệt (từ sản phẩm Run-10).
7 Khả năng truy nguyên và kiểm toán nhất quán (Provenance)
Mọi số liệu được trích dẫn trong bài đều có thể truy ngược từng mục trong bảng tổng hợp nghiêm ngặt và hồ sơ kiểm toán đã lưu trữ. Để phần thân bài dễ đọc hơn, chuỗi truy nguyên đầy đủ (danh sách tag, bảng kiểm toán, danh mục checksum và cách kiểm tra) đã được chuyển sang Phụ lục A.
8 Khả năng tái lập và lưu trữ Zenodo (Reproducibility & Archive)
Tuyên bố khả dụng dữ liệu và mã: dữ liệu đường cong quay SPARC và dữ liệu thấu kính yếu KiDS-1000 dùng trong bài đều là dữ liệu công khai. Báo cáo cấp xuất bản đã được lưu trữ trên Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), và gói tái lập đầy đủ đã được lưu trữ trên Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Các bước thực hiện chi tiết, môi trường phụ thuộc, danh mục lưu trữ và thông tin kiểm tra hash xem ở Phụ lục A; thiết kế, nhãn chạy và sản phẩm của phép thử áp lực chuẩn hóa mốc nền DM (P1A) xem ở Phụ lục B.
Dưới cùng Concept DOI của gói tái lập đầy đủ (https://doi.org/10.5281/zenodo.18526286), chúng tôi cung cấp hai lối vào tái lập theo mục đích:
• P1 (thân bài) full_fit_runpack: tái lập RC-only / closure / joint và các quét độ vững của EFT so với DM_RAZOR, đồng thời sinh các tài sản như Bảng S1a/S1b và Hình S3/S4 trong phần thân bài;
• P1A (Phụ lục B) full_fit_runpack: tái lập phép thử áp lực chuẩn hóa mốc nền DM (SCAT/AC/FB + hierarchical c–M scatter prior + core1p + lensing m + DM_STD; bao gồm đối chứng EFT_BIN), đồng thời sinh các tài sản Phụ lục B như Bảng B1 và Hình B1.
Các bảng/hình bổ sung của P1A cùng full_fit_runpack sẽ được đưa vào cùng Concept DOI dưới dạng tệp bổ sung, nhằm duy trì một lối vào lưu trữ duy nhất.
9 Lời cảm ơn và tuyên bố
9.1 Lời cảm ơn
Chúng tôi cảm ơn các nhóm SPARC và KiDS-1000 đã cung cấp dữ liệu và tài liệu công khai; cảm ơn những người tham gia vào quy trình tái dựng và kiểm toán của dự án.
9.2 Đóng góp của tác giả
Guanglin Tu chịu trách nhiệm đề xuất khái niệm, thiết kế phương án, triển khai kỹ thuật, sắp xếp dữ liệu, phân tích hình thức, hiện thực hóa quy trình tái lập và kiểm toán, cũng như viết bài.
9.3 Nguồn kinh phí
Tác giả Guanglin Tu tự tài trợ cá nhân (không có tài trợ bên ngoài / không có mã quỹ).
9.4 Lợi ích cạnh tranh
Tác giả Guanglin Tu có liên hệ với “Nhóm công tác EFT, Shenzhen Energy Filament Science Research Co., Ltd. (Trung Quốc)”; không có lợi ích cạnh tranh nào khác.
9.5 Hỗ trợ AI
OpenAI GPT-5.2 Pro và Gemini 3 Pro được dùng để trau chuốt ngôn ngữ, biên tập cấu trúc và sắp xếp quy trình tái lập; không được dùng để sinh hoặc sửa dữ liệu, kết quả, hình bảng hay mã; không được dùng để sinh trích dẫn. Tác giả chịu hoàn toàn trách nhiệm về nội dung toàn văn và độ chính xác của các trích dẫn.
10 Tài liệu tham khảo
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34-40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359-3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986-2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573-2590. DOI: https://doi.org/10.1093/mnras/stw713
- Thuyết Sợi Năng Lượng. Zenodo (kho lưu trữ khoa học mở) DOI: https://doi.org/10.5281/zenodo.18517411
Phụ lục A: Chi tiết về khả năng truy nguyên và tái lập
Phụ lục này tổng hợp thông tin phục vụ lưu trữ dài hạn về khả năng truy nguyên và tái lập (nhãn chạy, kết quả kiểm toán, danh mục lưu trữ và các điểm cần đối chiếu), để người đọc có thể kiểm tra và tái lập khi cần.
A.1 Chi tiết truy nguyên và kiểm toán
Để bảo đảm khả năng truy nguyên dài hạn, dự án dùng timestamp tag cho mỗi lần chạy và mỗi đầu ra, đồng thời giữ lại sản phẩm lịch sử thay vì ghi đè. Các số liệu cốt lõi được trích dẫn trong bản thảo lấy từ tổng hợp nghiêm ngặt (compile_tag=20260205_035929) và đã vượt qua các kiểm toán nhất quán sau:
• Mọi bảng theo giai đoạn đều mang run_tag và tag giai đoạn; script tổng hợp nghiêm ngặt chọn nguồn bảng canonical “đầy đủ và nhất quán” từ report/tables.
• Các giá trị trong Tab_Z1_master_summary và Tab_Z2_conclusion_highlights được đối chiếu từng mục với bảng canonical đã chọn.
• Khi sinh PDF, các “tag của bảng/hình được trích dẫn” được kiểm toán nhãn để bảo đảm không trộn lẫn sản phẩm cũ.
Các nhãn then chốt (dùng để định vị toàn bộ sản phẩm trung gian): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_205333; loo_tag=20260204_212017; shuffle_tag=20260204_221053; strict compile_tag=20260205_035929.
Kết quả kiểm toán nhất quán: Tab_AUDIT_checks_strict cho thấy pass=9, fail=0, skip=0 (xem gói release để biết chi tiết).
A.2 Các bước tái lập và danh mục lưu trữ
Nghiên cứu này dùng một hệ tái lập gồm “báo cáo cấp xuất bản + tài liệu bổ sung bảng/hình + gói chạy lại đầy đủ”: người đọc có thể trực tiếp xem Tables & Figures Supplement để kiểm tra từng mục mọi tài sản bảng/hình được trích dẫn trong bài; nếu cần tái lập số liệu và chuỗi kiểm toán từ đầu, có thể dùng full_fit_runpack để tải dữ liệu và chạy lại toàn bộ quy trình (sau khi chạy xong, có thể dùng script đối chiếu bảng reference trong gói để xác minh nhất quán các giá trị bảng).
A.2.1 Quickstart tái lập (RUN_FULL, Windows PowerShell)
Mục này đưa ra một đường tái lập ngắn hơn (Windows PowerShell). Để kiểm tra nhanh, nên trực tiếp đọc Tables & Figures Supplement và đối chiếu từng bảng/hình được trích dẫn trong bài. Nếu cần tái lập đầu-cuối và sinh toàn bộ bảng/hình cùng sản phẩm kiểm toán, hãy dùng full_fit_runpack: làm theo README/ONE_PAGE_REPRO_CHECKLIST trong gói để chạy verify_checksums.ps1 và RUN_FULL.ps1, sau đó so sánh các bảng đầu ra với bảng reference.
Lối vào lưu trữ Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Nhãn chuỗi chính của bài: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag: 20260205_112442.
A.2.2 Vật liệu lưu trữ và các điểm đối chiếu then chốt (Packages & checks)
Zenodo archive cung cấp 3 nhóm vật liệu bổ sung cho nhau: (1) báo cáo cấp xuất bản (bài này, v1.1; bao gồm Phụ lục B: phép thử áp lực chuẩn hóa mốc nền DM P1A); (2) Tables & Figures Supplement (tài liệu bổ sung bảng và hình: bao phủ toàn bộ bảng/hình được trích dẫn trong bài, tương ứng riêng cho P1 và P1A); (3) full_fit_runpack (gói tái lập đầy đủ: tải dữ liệu từ đầu và chạy lại toàn bộ quy trình, tương ứng riêng cho P1 và P1A). Trong đó (1)-(2) hỗ trợ kiểm tra nhanh, còn (3) dùng cho tái lập đầu-cuối.
Loại vật liệu | Tên tệp (ví dụ) | Công dụng và định vị (khuyến nghị đọc theo thứ tự này) |
Báo cáo cấp xuất bản (tiếng Trung và tiếng Anh) | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | Báo cáo đầy đủ lưu trữ trên Zenodo; thân bài nêu kết luận chính và kiểm toán độ vững, Phụ lục B nêu P1A (phép thử áp lực chuẩn hóa mốc nền DM). |
Tables & Figures Supplement (P1) | P1_RC_GGL_supplement_figs_tables_V1_1.zip | Toàn bộ bảng (CSV) và hình (PNG) được trích dẫn trong thân bài, gồm script sinh và tệp nhãn. |
Tables & Figures Supplement (P1A) | P1A_supplement_figs_tables_v1.zip | Toàn bộ bảng và hình được trích dẫn trong Phụ lục B (P1A), gồm Tab_S1_P1A_scoreboard và Fig_S1_P1A_scoreboard. |
full_fit_runpack (P1) | P1_RC_GGL_full_fit_runpack_v1_1.zip | Tái lập đầy đủ đầu-cuối: tải dữ liệu từ đầu và chạy lại RC-only/closure/joint cùng các quét độ vững. |
full_fit_runpack (P1A) | P1A_RC_GGL_full_fit_runpack_v1.zip | Tái lập đầy đủ đầu-cuối (Phụ lục B): chạy lại DM 7+1 + DM_STD (bao gồm đối chứng EFT_BIN) và sinh tài sản phụ lục; trong gói có script đối chiếu bảng reference để xác minh nhất quán giá trị bảng. |
Khuyến nghị trích dẫn: khi trích dẫn bài viết này hoặc vật liệu tái lập đi kèm, vui lòng ghi Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).
Các sản phẩm then chốt cần xuất hiện và có thể đối chiếu sau khi tái lập gồm:
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (tổng hợp khép kín)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (tổng hợp khớp liên hợp)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (quét σ_int)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (quét R_min)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (quét cov-shrink)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (tiêu giảm)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (đối chứng âm)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (bảng chính Strict; tương ứng với Bảng S1a/S1b và số liệu trong thân bài)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (PDF tổng hợp cấp xuất bản; có thể dùng để xem nhanh và trích dẫn)
Phụ lục B: P1A - Phép thử áp lực chuẩn hóa mốc nền DM (DM 7+1 + DM_STD; bao gồm đối chứng EFT)
Phụ lục này ghi lại một công trình mở rộng “phép thử áp lực chuẩn hóa mốc nền DM” (P1A) nhất quán với giao thức khép kín của phần thân bài. Định vị của nó là: trong khi không đưa vào quá nhiều bậc tự do và không thay đổi ánh xạ dùng chung RC-bin→GGL-bin hay khung kiểm toán, nâng mốc nền DM_RAZOR tối thiểu dùng trong phần thân bài (NFW + c–M cố định, không scatter/không co rút/không core) thành một tập mốc nền DM gần hơn với thực hành thiên văn vật lý và có sức chống đỡ tốt hơn trước các chất vấn thường gặp. P1A bao phủ và mở rộng ba nhánh thử áp lực trước đó: trên cơ sở giữ SCAT/AC/FB, nó thêm hierarchical c–M scatter prior, core proxy và lensing shear calibration, rồi đưa ra mô hình tổ hợp DM_STD để làm đối chứng phòng vệ mạnh nhất.
Ghi chú bổ sung: các số liệu như cường độ khép kín trong Phụ lục B (P1A) dùng ngân sách Monte Carlo cao hơn (ví dụ ndraw=400, nperm=24), khác với ngân sách quick dùng trong thân bài để bao phủ đầy đủ họ nhân EFT (ví dụ ndraw=60, nperm=12). Vì vậy, các giá trị tuyệt đối có thể có trôi lấy mẫu bậc O(10); nhưng so sánh giữa các mô hình trong cùng bảng/cùng ngân sách là công bằng, và dấu cùng bậc độ lớn của lợi thế vẫn ổn định giữa các ngân sách.
B.1 Mục đích và định vị (Why P1A, and why as an Appendix)
P1A không cố gắng vét cạn mọi khả năng mô hình hóa halo ΛCDM (ví dụ phi cầu, phụ thuộc môi trường, liên kết thiên hà-halo phức tạp hay vật lý baryon nhiều chiều). Ngược lại, P1A tuân theo nguyên tắc “ít chiều, có thể kiểm toán, có thể tái lập”: mỗi mô-đun tăng cường chỉ đưa vào ≤1 tham số hiệu dụng then chốt và tiếp tục chịu ba ràng buộc cứng của bài này:
(i) Sổ cái tham số: tham số mới phải được ghi sổ rõ ràng và báo cáo cùng tiêu chí thông tin (AICc/BIC);
(ii) Ánh xạ dùng chung: vẫn dùng cùng ánh xạ nhóm RC-bin→GGL-bin;
(iii) Kiểm định khép kín: tăng chất lượng RC-only hoặc joint logL thôi chưa đủ; phần tăng cường phải được kiểm tra bằng khả năng chuyển giao RC→GGL.
B.2 DM 7+1 + DM_STD: định nghĩa mô-đun, tham số và cách đi vào hậu nghiệm liên hợp
Là một runpack độc lập, P1A cung cấp 8 workspace DM (DM 7+1) và 1 đối chứng EFT: lấy DM_RAZOR làm nền, xây dựng ba tăng cường một tham số legacy (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), thêm ba mô-đun phòng vệ chuẩn hơn (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), rồi đưa ra mô hình tổ hợp DM_STD; EFT_BIN được giữ làm đối chứng EFT cùng quy ước.
Workspace | dm_model | Tham số mới (≤1) | Động cơ vật lý (cốt lõi) | Nguyên tắc triển khai (thân thiện kiểm toán) |
DM_RAZOR | NFW (fixed c–M, no scatter) | — | Mốc nền halo ΛCDM tối thiểu, có thể kiểm toán; dùng đối chứng nghiêm ngặt với EFT | Ánh xạ dùng chung cố định; sổ cái tham số nghiêm ngặt; baseline chỉ dùng cho so sánh tương đối |
DM_RAZOR_SCAT | NFW + c–M scatter (legacy) | σ_logc | Quan hệ c–M có tán xạ; xấp xỉ bằng scatter log-normal một tham số | ≤1 tham số mới; vẫn dùng ánh xạ chung; lấy tăng ích khép kín làm chuẩn nghiệm thu |
DM_RAZOR_AC | NFW + Adiabatic Contraction (legacy) | α_AC | Baryon rơi vào có thể gây co rút đoạn nhiệt của halo; xấp xỉ cường độ bằng một tham số | ≤1 tham số mới; không đổi ánh xạ; báo cáo biến đổi AICc/BIC và tăng ích khép kín |
DM_RAZOR_FB | NFW + feedback core (legacy) | log r_core | Feedback có thể tạo core ở vùng trong; xấp xỉ bằng thang core một tham số | ≤1 tham số mới; cùng quy ước closure/đối chứng âm; không lấy cải thiện RC-only làm mục tiêu duy nhất |
DM_HIER_CMSCAT | Hierarchical c–M scatter + prior | σ_logc (hier) | Chuẩn hóa tầng bậc c_i∼logN(c(M_i),σ_logc); tác động đồng thời lên hậu nghiệm liên hợp RC và GGL | Tiên nghiệm tường minh; biên hóa latent c_i; vẫn giữ ít chiều và có thể kiểm toán |
DM_CORE1P | 1-parameter core proxy (coreNFW/DC14-inspired) | log r_core | Dùng core proxy một tham số để bắt hiệu ứng chính của baryonic feedback, tránh chi tiết hình thành sao nhiều chiều | Trích dẫn tài liệu chuẩn; ≤1 tham số mới; gắn với kiểm định khép kín |
DM_RAZOR_M | NFW + lensing shear-calibration nuisance | m_shear (GGL) | Hấp thụ sai số hệ thống then chốt phía thấu kính yếu bằng tham số hiệu dụng, giảm rủi ro “đọc sai số hệ thống thành vật lý” | Nuisance được ghi sổ rõ; không cho phép tác động ngược lên RC; kết quả lấy độ vững khép kín làm chính |
DM_STD | Standardized DM baseline (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Đưa ba chất vấn thường gặp nhất vào một mốc nền chuẩn vẫn ít chiều | Báo cáo cùng sổ cái tham số + tiêu chí thông tin; closure là chỉ báo chính; dùng làm đối chứng phòng vệ DM mạnh nhất |
Lưu ý: tên tham số nói trên theo triển khai kỹ thuật (ví dụ σ_logc, α_AC, log r_core, m_shear). Trọng tâm thiết kế của P1A là “làm phía DM mạnh hơn một chút nhưng vẫn có thể kiểm toán”, chứ không biến phía DM thành một bộ khớp nhiều chiều khó kiểm soát. Đặc biệt, DM_HIER_CMSCAT đưa c–M scatter vào theo cách tầng bậc: nồng độ c_i của mỗi halo được đặt quanh c(M_i) với tán xạ log-normal, còn σ_logc toàn cục kiểm soát độ rộng; mô-đun core dùng log r_core làm thang đại diện cho feedback baryon; mô-đun m chỉ đi vào phía GGL để bắt sai số hiệu chuẩn shear.
B.3 Giao thức thống kê và quy ước sản phẩm nhất quán với phần thân bài
P1A dùng lại toàn bộ sản phẩm dữ liệu, ánh xạ dùng chung và khung kiểm toán của phần thân bài. Trình tự thực hiện và quy ước sản phẩm giữ nhất quán:
(1) Run-1: suy luận RC-only (xuất posterior_samples.npz và metrics.json);
(2) Run-2: kiểm định khép kín RC→GGL (xuất closure_summary.json và baseline hoán vị);
(3) Run-3: khớp liên hợp RC+GGL (xuất joint metrics và trace);
(4) Tổng hợp cuối: Tab_S1_P1A_scoreboard và Fig_S1_P1A_scoreboard.Tất cả so sánh đều được báo cáo theo DM_RAZOR baseline trong cùng runpack, để tránh trộn lẫn với tag cũ hoặc ngân sách Monte Carlo khác.
B.4 Kết quả chính, lối vào bảng/hình và kế hoạch lưu trữ (cùng DOI)
Mục này trình bày các kết luận định lượng cốt lõi của P1A. Bảng B1 tổng hợp các chỉ báo chính của RC-only, kiểm định khép kín RC→GGL và khớp liên hợp RC+GGL (trong ngoặc là chênh lệch so với DM_RAZOR baseline); cường độ khép kín được định nghĩa là ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (càng lớn càng tốt). Hình B1 trực quan hóa cùng scoreboard. Các điểm kết luận là:
• Trong ba nhánh legacy, chỉ DM_RAZOR_FB đem lại cải thiện ròng nhỏ cho cường độ khép kín (+7.25); SCAT và AC không cải thiện độ khép kín.
• Các mô-đun chuẩn hóa mới (hierarchical c–M scatter, core proxy, lensing m) có thể cải thiện rõ rệt joint logL trong một số trường hợp, nhưng không chuyển hóa thành cường độ khép kín cao hơn.
• DM_STD là đối chứng phòng vệ mạnh nhất ở phía DM, song cường độ khép kín của nó vẫn không vượt EFT_BIN trong cùng logic đánh giá.
• Vì thế, P1A làm giảm nguy cơ “strawman baseline” nhưng không đảo ngược thông điệp chính của phần thân bài: tín hiệu khép kín xuyên dữ liệu vẫn nghiêng về khung EFT.
Để tiện đối chiếu trực tiếp với so sánh chính trong phần thân bài, Tab S1a-S1b của thân bài tổng hợp kết quả đối chứng nghiêm ngặt giữa họ EFT và DM_RAZOR: các mô hình EFT cải thiện ΔlogL_total≈1155-1337 so với DM_RAZOR trong khớp liên hợp, và đạt ΔlogL_closure=172-281 trong kiểm định khép kín. P1A chỉ làm cho phía DM trở thành “đối chứng khó hơn”; vai trò của nó là giảm rủi ro chất vấn “strawman baseline / systematics-as-physics”, chứ không thay thế bảng đối chứng chính trong thân bài.
Bảng B1 | Scoreboard P1A (càng lớn càng tốt; ngoặc là chênh lệch so với DM_RAZOR baseline).
Nhánh mô hình (workspace) | Δk | RC-only best logL_RC (Δ) | Cường độ khép kín ΔlogL_closure (Δ) | Joint best logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Hình B1 | Scoreboard P1A: ΔlogL của khép kín và khớp liên hợp so với baseline (càng lớn càng tốt).

Một nhóm nhãn chạy đã hoàn thành tương ứng với phụ lục này như sau (dùng để định vị sản phẩm trung gian và bảng/hình của P1A):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.
B.5 Cách trích dẫn khuyến nghị (Appendix citation note)
Khi cần trích dẫn phần “phép thử áp lực chuẩn hóa mốc nền DM” ngoài kết luận chính, nên trích dẫn kết luận chính của bài và ghi thêm: ‘See Appendix B (P1A) for standardized DM baseline kiểm định áp lựcs (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’