P1_RC_GGL: Kiểm định đóng kín nghiêm ngặt về động lực học thiên hà và thấu kính yếu (Rotation Curves + GGL)
Khung hấp dẫn trung bình EFT so với đường chuẩn NFW tối thiểu của vật chất tối lạnh (DM)
Xem bản gốc của báo cáo đánh giá:
1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc
2. Gemini: https://gemini.google.com/share/773ec96d75a0
3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04
4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46
5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm
0 Tóm tắt điều hành
Báo cáo này là một bản hoàn chỉnh cấp công bố được lưu trữ trên Zenodo. Nó cung cấp một chuỗi tích hợp, có thể kiểm toán, bao quát dữ liệu, sổ cái mô hình, so sánh công bằng, kiểm định đóng kín và các vật liệu tái lập. Phụ lục B (P1A) đóng vai trò bổ sung về độ vững, tập trung vào các phép thử áp lực với “đường chuẩn DM tiêu chuẩn hơn + một hệ thống sai số thấu kính then chốt”, nhằm kiểm tra độ nhạy của các kết luận chính đối với mô hình DM thực tế hơn và cách xử lý hệ thống sai số thấu kính.
Kết luận cốt lõi (bốn câu có thể trích dẫn trực tiếp; xem Mục 2.4):
(1) Trong phép khớp đường cong quay (RC), họ mô hình EFT vượt trội đáng kể so với DM_RAZOR dưới mọi tổ hợp hàm nhân/tiên nghiệm; mức cải thiện điển hình là Δlog𝓛_RC ≈ 10^3 (xem Bảng S1a).
(2) Trong kiểm định đóng kín RC→GGL, EFT cho khả năng chuyển giao xuyên đầu dò mạnh hơn: cường độ đóng kín Δlog𝓛_closure (True−Perm) cao hơn đáng kể so với DM_RAZOR, và khác biệt này vững trước các quét co rút hiệp phương sai, R_min và σ_int (xem Hình S3, Bảng S1b).
(3) Trong phép khớp chung (RC+GGL), EFT vẫn giữ ưu thế ổn định; trong đối chứng âm phá vỡ ánh xạ chung, ưu thế này sụp đổ, ủng hộ cách hiểu rằng “hiệu ứng hấp dẫn trung bình” đến từ ánh xạ chung chứ không phải từ một phép khớp tình cờ (xem Hình S4).
(4) Phụ lục B (P1A), mà không làm tăng đáng kể số chiều, dùng các mô-đun đường chuẩn DM tiêu chuẩn hơn và một tham số nuisance then chốt của hệ thống sai số thấu kính để thử áp lực phía DM; các tăng cường này không xóa bỏ ưu thế đóng kín của EFT (xem Bảng B1, Hình B1).
Khả dụng dữ liệu và mã: báo cáo Concept DOI 10.5281/zenodo.18526334; gói tái lập đầy đủ Concept DOI 10.5281/zenodo.18526286. Các nhãn tương ứng với Phụ lục B (P1A) là run_tag=20260213_151233, closure_tag=20260213_161731, joint_tag=20260213_195428.
1 Tóm tắt
Chúng tôi thực hiện một so sánh định lượng có thể tái lập giữa hai khung lý thuyết dưới cùng một dữ liệu và cùng một giao thức thống kê: mô hình “hiệu chỉnh hấp dẫn trung bình” do Thuyết Sợi Năng Lượng (Energy Filament Theory, EFT; khác với cách viết tắt phổ biến của Effective Field Theory) đề xuất, và mô hình đường chuẩn hào quang NFW của vật chất tối lạnh (DM_RAZOR). Trong đó, DM_RAZOR được cố ý chọn làm “đường chuẩn DM tối thiểu”: hào quang NFW + quan hệ c–M cố định (không có halo-to-halo scatter), nhằm cung cấp một đối chứng có thể kiểm toán và tái lập. Đồng thời cần nhấn mạnh rằng bài báo này xem EFT như một tham số hóa hiện tượng luận, kiểu MOND, của trường hiệu dụng/đáp ứng hiệu dụng để kiểm định trong một giao thức thống kê thống nhất, chứ không suy diễn các nguyên lý vi mô thứ nhất của nó trong bài này.
Dữ liệu bao gồm: 2.295 điểm dữ liệu vận tốc từ các đường cong quay SPARC (RC), đã được tiền xử lý và chia bin thống nhất (104 thiên hà, 20 RC-bin), cùng với mật độ mặt dư ΔΣ(R) của thấu kính yếu thiên hà–thiên hà (GGL) KiDS-1000 (4 bin khối lượng sao × 15 điểm R cho mỗi bin, tổng cộng 60 điểm, sử dụng hiệp phương sai đầy đủ).
Chúng tôi lần lượt thực hiện suy luận RC-only, kiểm định đóng kín RC→GGL (closure), suy luận GGL-only và suy luận chung RC+GGL, đồng thời dùng kiểm toán nhất quán để bảo đảm mọi giá trị số được trích dẫn đều có thể truy vết. Dưới sổ cái tham số nghiêm ngặt và các ràng buộc ánh xạ chung (DM: 20 tham số log M200_bin; EFT: 20 tham số log V0_bin + 1 tham số toàn cục log ℓ), họ mô hình EFT vượt trội đáng kể so với DM_RAZOR trong phép khớp chung: ΔlogL_total = 1155–1337 (so với DM_RAZOR). Quan trọng hơn, kiểm định đóng kín cho thấy hậu nghiệm RC có năng lực dự đoán không tầm thường đối với GGL: cường độ đóng kín của EFT là ΔlogL_closure = 172–281, cao hơn 127 của DM_RAZOR; khi nhóm RC-bin→GGL-bin được xáo trộn ngẫu nhiên, tín hiệu đóng kín sụp xuống 6–23, xác nhận rằng tín hiệu này không phải ngẫu nhiên thống kê hay thiên lệch triển khai. Trong các quét hệ thống theo σ_int, R_min và co rút hiệp phương sai, ưu thế tương đối của EFT vẫn dương và ổn định về bậc độ lớn. Để đáp lại các nghi vấn thường gặp như “đường chuẩn DM quá yếu” hoặc “hệ thống sai số bị nhầm thành vật lý”, Phụ lục B (P1A) cung cấp một phép thử áp lực đường chuẩn DM tiêu chuẩn hơn nhưng vẫn ít chiều và có thể kiểm toán, bao gồm c–M scatter phân cấp + prior, proxy core một tham số, lensing m và mô hình tổ hợp DM_STD; dưới cùng giao thức đóng kín, các tăng cường này không xóa bỏ ưu thế đóng kín của EFT (xem Bảng B1/Hình B1).
Từ khóa: đường cong quay; thấu kính yếu thiên hà–thiên hà; kiểm định đóng kín; EFT; vật chất tối lạnh; suy luận Bayes
2 Dẫn nhập và tổng quan kết quả
Đường cong quay (RC) và thấu kính yếu thiên hà–thiên hà (GGL) là hai đầu dò hấp dẫn bổ sung cho nhau: RC ràng buộc thế động lực học và quan hệ gia tốc xuyên tâm (RAR) trong mặt phẳng đĩa, còn GGL đo phân bố khối lượng chiếu và đáp ứng hấp dẫn ở thang hào quang. Đối với bất kỳ lý thuyết ứng viên nào, điểm then chốt không phải là liệu nó có thể khớp riêng từng bộ dữ liệu hay không, mà là liệu nó có thể giải thích chúng một cách nhất quán dưới cùng một ánh xạ xuyên dữ liệu và các ràng buộc chung hay không.
Vì vậy, bài này lấy “kiểm định đóng kín (closure test)” làm giao thức thống kê cốt lõi: trước hết dùng hậu nghiệm RC-only để dự đoán tiến GGL, rồi so sánh với đối chứng âm trong đó ánh xạ RC-bin→GGL-bin bị hoán vị/xáo trộn (permutation / shuffle), nhằm đánh giá khả năng chuyển giao dự đoán xuyên dữ liệu và loại trừ tín hiệu giả do thiên lệch triển khai hoặc khớp tình cờ.
Định vị và phạm vi lý thuyết: bài này không cố gắng đưa ra phép suy diễn từ nguyên lý thứ nhất vi mô của EFT (Thuyết Sợi Năng Lượng) hay một dạng thức tương đối tính hoàn chỉnh. Ngược lại, chúng tôi xem EFT như một tham số hóa ít chiều, kiểu MOND, của trường hiệu dụng/đáp ứng hiệu dụng (được mô tả bởi hàm nhân f(x) và thang toàn cục ℓ), và dùng kiểm định đóng kín RC→GGL dưới sổ cái tham số nghiêm ngặt để kiểm tra tính nhất quán xuyên dữ liệu và năng lực dự đoán chuyển giao của nó.
Tuyên bố về chương trình nghiên cứu và phạm vi: bài này là một phần của chương trình truy hồi quan sát chuỗi P đang tiếp diễn. Trong dữ liệu ở thang thiên hà hiện có, chúng tôi tìm kiếm hai loại đóng góp nền hiệu dụng có thể tồn tại: (i) một “nền hấp dẫn trung bình” (mean gravity floor) có thể mô tả bằng đáp ứng hấp dẫn trung bình sau thô hóa, và (ii) một “nền nhiễu” (stochastic/noise floor) liên quan đến dao động của các quá trình vi mô. Trong bài này (P1), chúng tôi chỉ tập trung vào loại thứ nhất: không đưa vào bất kỳ giả thuyết nào về cơ chế sinh vi mô, mà dùng kiểm định đóng kín RC→GGL để truy hồi dấu hiệu quan sát của nền hấp dẫn trung bình, rồi so sánh với đường chuẩn DM có thể kiểm toán trong một giao thức đối chứng thống nhất. Như một hình ảnh vật lý gợi ý, nếu tồn tại các bậc tự do ngắn sống, sự phân rã/hủy cặp của chúng có thể chuyển khối lượng nghỉ thành năng lượng–xung lượng do các bậc tự do khác mang, tương ứng tự nhiên ở mức hiệu dụng với phân rã “đóng góp trung bình + đóng góp dao động”; tuy nhiên bài này không mô hình hóa định lượng hình ảnh vi mô đó.
Để tránh diễn giải quá mức, ranh giới phạm vi của bài này như sau:
• Bài này làm gì: dưới sổ cái tham số nghiêm ngặt và ràng buộc ánh xạ chung, dùng kiểm định đóng kín để đo khả năng chuyển giao dự đoán xuyên dữ liệu, đồng thời so sánh có thể tái lập giữa đáp ứng hấp dẫn trung bình EFT và đường chuẩn DM.
• Bài này không làm gì: không thảo luận cơ chế sinh vi mô, độ phong phú/tuổi thọ hay ràng buộc vũ trụ học; không mô hình hóa hạng ngẫu nhiên tương ứng với “nền nhiễu”.
• Bài này không tuyên bố gì: không nhằm lật đổ vật chất tối; P1 không đưa ra phán quyết cuối cùng về việc “nền” có tồn tại hay không, mà chỉ báo cáo bằng chứng theo giai đoạn — trong miền đo vững được chọn ở đây, dữ liệu thiên về các mô hình có chứa đáp ứng hấp dẫn trung bình.
Đồng thời, chúng tôi làm rõ rằng DM_RAZOR chỉ đại diện cho một đường chuẩn NFW tối thiểu và có thể kiểm toán (c–M cố định và không có scatter; không có co lại đoạn nhiệt Adiabatic Contraction, feedback core, phi cầu hay hạng môi trường). Vì vậy, kết luận chính của phần thân bài bị giới hạn nghiêm ngặt ở phát biểu sau: dưới đường chuẩn tối thiểu và các ràng buộc sổ cái tham số/ánh xạ nghiêm ngặt, EFT có tính nhất quán xuyên dữ liệu mạnh hơn. Để trả lời câu hỏi thường gặp rằng một đường chuẩn ΛCDM tiêu chuẩn hơn và mô hình hóa hệ thống sai số thấu kính then chốt có làm thay đổi đáng kể kết luận hay không, chúng tôi đưa các tăng cường DM tiêu chuẩn hơn nhưng vẫn ít chiều, có thể kiểm toán, cùng một tham số nuisance phía thấu kính vào Phụ lục B (P1A: kiểm thử áp lực chuẩn hóa đường chuẩn DM), đồng thời giữ hoàn toàn cùng ánh xạ chung và cùng giao thức kiểm định đóng kín như trong phần chính (xem Bảng B1/Hình B1).
2.1 Tab S1a–S1b: Tóm tắt chỉ số then chốt (Strict)
Bảng S1a đưa ra các chỉ số so sánh chính của phép khớp chung (RC+GGL): logL, ΔlogL, AICc và BIC; Bảng S1b đưa ra các chỉ số của kiểm định đóng kín và quét độ vững: closure, đối chứng âm shuffle, và các khoảng quét σ_int / R_min / cov-shrink. Tất cả giá trị đều đến từ bảng tổng hợp chính nghiêm ngặt Tab_Z1_master_summary và có thể truy vết từng mục trong gói lưu trữ phát hành.
Bảng S1a | Các chỉ số so sánh chính của phép khớp chung (RC+GGL, Strict).
Mô hình (workspace) | Nhân W | k | logL_total chung (best) | ΔlogL_total so với DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Bảng S1b | Các chỉ số đóng kín và độ vững (Strict).
Mô hình (workspace) | ΔlogL đóng kín (true-perm) | ΔlogL sau shuffle đối chứng âm | Khoảng ΔlogL quét σ_int | Khoảng ΔlogL quét R_min | Khoảng ΔlogL quét cov-shrink |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
2.2 Hình S3: Cường độ đóng kín (RC-only → dự đoán GGL)
Cường độ đóng kín được định nghĩa là ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: trên các mẫu hậu nghiệm RC-only, GGL được dự đoán tiến và so sánh với đối chứng âm trong đó ánh xạ RC-bin→GGL-bin bị hoán vị.

Hình S3 | Cường độ đóng kín (càng lớn càng tốt): ưu thế log-likelihood trung bình của dự đoán RC-only → GGL.
2.3 Hình S4: So sánh chính trong phép khớp chung (RC+GGL)
Ưu thế khớp chung được định nghĩa là ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Dưới cùng dữ liệu, cùng ánh xạ và quy mô tham số gần như giống nhau, họ mô hình EFT đạt log-likelihood chung cao hơn đáng kể.

Hình S4 | Ưu thế khớp chung (càng lớn càng tốt): best logL_total của RC+GGL so với DM_RAZOR.
2.4 Bốn kết luận (có thể trích dẫn trực tiếp)
(1) Trong phân tích chung thống nhất của đường cong quay SPARC và thấu kính yếu KiDS-1000, mô hình khung hấp dẫn trung bình EFT vượt trội có hệ thống so với DM_RAZOR dưới giao thức đối chứng nghiêm ngặt: ΔlogL_total = 1155–1337 (so với DM_RAZOR).
(2) Kiểm định đóng kín RC→GGL cho thấy tính nhất quán dự đoán của EFT mạnh hơn: ΔlogL_closure = 172–281, trong khi DM_RAZOR là 127; sau khi xáo trộn ngẫu nhiên nhóm RC-bin→GGL-bin, tín hiệu đóng kín sụp xuống 6–23, cho thấy tín hiệu phụ thuộc vào ánh xạ xuyên dữ liệu đúng chứ không phải khớp tình cờ.
(3) Các quét hệ thống theo σ_int, R_min và co rút hiệp phương sai đều không thay đổi dấu và bậc độ lớn của kết luận “EFT ưu thế hơn DM_RAZOR”, cho thấy kết luận này vững trước các nhiễu hệ thống thường gặp.
(4) Dưới cùng giao thức đóng kín, Phụ lục B (P1A) tăng cường đường chuẩn DM theo cách “chuẩn hóa và có thể kiểm toán”: giữ ba tăng cường một tham số (SCAT/AC/FB), đồng thời bổ sung c–M scatter phân cấp + prior, proxy core một tham số và shear-calibration m phía thấu kính (cùng mô hình tổ hợp DM_STD). Kết quả cho thấy chỉ nhánh feedback/core đem lại một mức tăng ròng nhỏ cho cường độ đóng kín (122.21→129.45, ΔΔlogL_closure≈+7.25), còn các tăng cường khác đóng góp không đáng kể hoặc âm cho cường độ đóng kín; vì vậy kết luận chính không phụ thuộc vào giả định rằng DM_RAZOR là một đường chuẩn quá yếu.
3 Dữ liệu và tiền xử lý
Nghiên cứu này sử dụng hai bộ dữ liệu công khai, và trong quy trình kỹ thuật, các bước tải xuống, kiểm tra (sha256) và tiền xử lý đều được hoàn tất bằng các script có thể truy vết. Để bảo đảm so sánh công bằng giữa các mô hình, mọi workspace (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) chia sẻ chính xác cùng các sản phẩm dữ liệu và ánh xạ chia bin.
3.1 Đường cong quay (RC, SPARC)
Dữ liệu RC đến từ các tệp Rotmod_LTG của cơ sở dữ liệu SPARC (175 tệp rotmod). Sau tiền xử lý, mẫu đưa vào mô hình hóa gồm 104 thiên hà, tổng cộng 2.295 điểm dữ liệu (r, V_obs), và được chia thành 20 RC-bin theo các quy tắc như khối lượng sao. Mỗi điểm dữ liệu gồm bán kính r (kpc), vận tốc quan sát V_obs (km/s), sai số σ_obs, cũng như vận tốc thành phần khí/đĩa/phình (V_gas, V_disk, V_bul).
3.2 Thấu kính yếu (GGL, KiDS-1000 / Brouwer+2021)
Dữ liệu GGL sử dụng mật độ mặt dư ΔΣ(R) trong Fig. 3 của Brouwer và cộng sự (2021) trên KiDS-1000 (4 bin khối lượng sao, mỗi bin 15 điểm R), cùng hiệp phương sai đầy đủ do họ cung cấp. Trong quy trình kỹ thuật, hiệp phương sai long-form ban đầu được tái dựng thành ma trận 15×15 cho mỗi bin, và trong kiểm toán Stage-B, kích thước cùng độ hợp lý số học được xác minh.
3.3 Ánh xạ RC-bin → GGL-bin và tổng cỡ mẫu
4 bin khối lượng GGL và 20 bin RC được nối bằng một ánh xạ cố định: mỗi GGL-bin tương ứng với 5 RC-bin, và đóng góp của RC-bin được lấy trung bình có trọng số theo số thiên hà. Ánh xạ này được giữ bất biến trong mọi mô hình, là ràng buộc cốt lõi để so sánh công bằng trong kiểm định đóng kín và khớp chung. Bộ dữ liệu chung cuối cùng có tổng số điểm n_total = 2355 (RC=2295, GGL=60).
4 Mô hình và phương pháp thống kê
4.1 Đặc tả toán học tối thiểu của EFT và DM (có thể kiểm toán/kiểm định)
Mục này đưa ra đặc tả toán học tối thiểu có thể đối chiếu trực tiếp với phần triển khai.
(a) Mô hình đường cong quay (RC)
Với mỗi điểm dữ liệu RC (r, V_obs, σ_obs), chúng tôi dùng chồng chất thành phần: V_mod²(r) = V_bar²(r) + V_extra²(r). Trong đó V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Các kết quả chính trong bản thảo này lấy Υ_d = Υ_b = 0.5 (phù hợp với khuyến nghị kinh nghiệm của SPARC; đồng thời giúp giảm các bậc tự do không cần thiết).
(b) Hiệu chỉnh hấp dẫn trung bình EFT (EFT)
Hạng bổ sung của EFT được tham số hóa dưới dạng “bình phương vận tốc trung bình”: V_extra²(r) = V0_bin² · f(r/ℓ). Ở đây V0_bin là tham số biên độ của mỗi RC-bin (20 tham số), ℓ là thang toàn cục (1 tham số), còn f(x) là hàm hình dạng nhân không thứ nguyên. Các hình dạng nhân được so sánh trong bài này (đều không đưa vào bậc tự do liên tục bổ sung) gồm:
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (đối chứng tùy chọn) gaussian: f(x)=erf(x/√2) (không đưa vào tập kết luận chính)
Động cơ vật lý (mở rộng): EFT hiểu đáp ứng hấp dẫn bổ sung ở thang thiên hà như một đáp ứng hiệu dụng sau khi thô hóa/lấy trung bình theo thang đối với các tác dụng vi mô hơn diễn ra trên thang hữu hạn. Trong bài này, chúng tôi không giả định một cơ chế vi mô cụ thể nào, mà dùng tham số hóa tối thiểu, có thể kiểm toán, để thực hiện so sánh và kiểm định có kiểm soát trong một giao thức thống kê thống nhất.
Để dễ trực giác, hạng bổ sung có thể viết dưới dạng gia tốc: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Khi r≫ℓ, f→1, V_extra→V0_bin, từ đó tạo ra đóng góp vận tốc bổ sung xấp xỉ phẳng ở vùng ngoài; khi r≪ℓ và f(x)≈x, có thể đưa vào thang gia tốc đặc trưng a0,bin≈V0_bin²/ℓ (khác một nhân tử hàm nhân O(1)), cung cấp trực giác kiểu MOND về thang chuyển tiếp trong–ngoài.
Họ nhân rời rạc được dùng trong bài này (none/exponential/yukawa/powerlaw_tail) có thể xem như các proxy ít chiều cho những “độ dốc ban đầu / tốc độ chuyển tiếp / đuôi dài hạn” khác nhau (ví dụ sàng lọc kiểu Yukawa so với đáp ứng có đuôi dài hơn), phục vụ kiểm thử áp lực độ vững chứ không nhằm vét cạn không gian mô hình. Trong phần thấu kính yếu, chúng tôi xây dựng khối lượng và mật độ bao hiệu dụng từ V_avg(r), rồi chiếu chúng để thu được ΔΣ(R); mật độ hiệu dụng này nên được hiểu là mô tả hiệu dụng của thế thấu kính dưới giả định đối xứng cầu và ánh xạ trường yếu (chi tiết đầy đủ đã chuyển sang Phụ lục A).
Các hình dạng nhân trên đều thỏa f(x)→1 khi x→∞ (tức V_extra²→V0² bão hòa), còn khi x≪1 thì cho tăng trưởng tuyến tính hoặc dưới tuyến tính: ví dụ exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Vì vậy, các hình dạng nhân khác nhau có khác biệt quan sát được về “độ dốc ban đầu” ở bán kính nhỏ, tốc độ chuyển tiếp và đuôi ngoài, và có thể được phân biệt bằng phép khớp chung RC+GGL cùng kiểm định đóng kín.
Dự đoán EFT cho thấu kính yếu ΔΣ(R) được lấy bằng cách suy ra khối lượng và mật độ bao từ V_avg(r), rồi thực hiện tích phân chiếu: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). Triển khai số dùng lưới logarit và tự thích nghi làm mịn trong các trường hợp bất thường để bảo đảm ổn định và tái lập.
(c) DM_RAZOR: đường chuẩn hào quang NFW của vật chất tối lạnh
Đồng thời, chúng tôi làm rõ rằng DM_RAZOR chỉ đại diện cho một đường chuẩn NFW tối thiểu, có thể kiểm toán (c–M cố định và không có scatter; không có co lại đoạn nhiệt Adiabatic Contraction, feedback core, phi cầu hay hạng môi trường). Để giảm rủi ro “strawman baseline”, bài này không tuyên bố các hiệu ứng đó không tồn tại; ngược lại, chúng tôi đưa chúng vào Phụ lục B (P1A) dưới dạng các phép thử áp lực ít chiều và có thể kiểm toán, bao gồm xử lý phân cấp c–M scatter, proxy core và tham số nuisance shear-calibration phía thấu kính.
4.2 Sổ cái mô hình và so sánh công bằng (tham số chung = định nghĩa đóng kín)
Số tham số trong tập so sánh chính là: DM_RAZOR k=20; họ EFT k=21 (1 tham số thêm là log ℓ toàn cục). Mọi mô hình chia sẻ cùng dữ liệu RC, cùng dữ liệu GGL và hiệp phương sai, cùng ánh xạ RC-bin→GGL-bin, cùng các hạng baryon và cùng chuyển đổi đơn vị. Ngoài ra, hình dạng nhân (none / exponential / yukawa / powerlaw_tail) là lựa chọn rời rạc, không đưa thêm tham số liên tục, nhờ đó tránh việc đạt ưu thế chỉ vì “thêm một bậc tự do”.
4.3 Likelihood, tiên nghiệm và bộ lấy mẫu
Likelihood RC dùng Gaussian đường chéo: σ_eff² = σ_obs² + σ_int²; kết quả chính cố định σ_int=5 km/s, và Run-5 quét σ_int. Likelihood GGL dùng Gaussian hiệp phương sai đầy đủ theo từng bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Mục tiêu chung là logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Các tiên nghiệm chủ yếu thể hiện biên khả thi vật lý (ràng buộc khoảng cho log ℓ, log V0, log M200); khi bật Υ và σ_int tự do thì dùng tiên nghiệm thông tin yếu (xem chi tiết trong phần triển khai và cấu hình gói release).
Bộ lấy mẫu sử dụng bước đi ngẫu nhiên Metropolis khối thích nghi: mỗi bước chỉ cập nhật một tiểu khối ngẫu nhiên của không gian tham số để cải thiện tỉ lệ chấp nhận ở số chiều cao, và kích thước bước được thích nghi nhẹ theo tỉ lệ chấp nhận trong cửa sổ (tỉ lệ chấp nhận mục tiêu khoảng 0.25). Kết quả chính dùng chế độ quick (các thiết lập như n_steps=800), và mỗi workspace xuất trace, phần dư cùng biểu đồ PPC để kiểm toán thủ công và bằng script.
4.4 Kiểm định đóng kín và đối chứng âm (định nghĩa)
Kiểm định đóng kín (Run-2) kiểm tra xem hậu nghiệm RC-only có thể dự đoán GGL hay không mà không khớp lại GGL. Cụ thể: trên các mẫu hậu nghiệm RC-only, tạo tiến ΔΣ(R) cho 4 GGL-bin và dùng hiệp phương sai đầy đủ để tính logL_true; sau đó hoán vị ngẫu nhiên ánh xạ nhóm RC-bin→GGL-bin để thu logL_perm. Cường độ đóng kín được định nghĩa là ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Ngoài ra, Run-10 xáo trộn lại 20 RC-bin thành 4×5 (shuffle) và tính lại đóng kín, nhằm kiểm tra tín hiệu đóng kín phụ thuộc mạnh đến đâu vào ánh xạ đúng.
5 Kết quả chính và diễn giải
5.1 Kết quả chính của phép khớp chung (RC+GGL)
best logL_total của phép khớp chung và ưu thế tương đối ΔlogL_total (so với DM_RAZOR) được trình bày trong Bảng S1a và Hình S4. Trong tập so sánh chính, EFT_BIN có ưu thế chung lớn nhất (ΔlogL_total=1337.210), trong khi các hình dạng nhân EFT khác cũng giữ ưu thế đáng kể (1154.827–1294.442). Theo các tiêu chuẩn thông tin (AICc/BIC), họ EFT cũng vượt trội rõ rệt so với DM_RAZOR, cho thấy ưu thế không đến từ thiên lệch về số tham số.
Ghi chú: đóng góp chính vào ΔlogL_total≈1337 đến từ hạng RC (trong phân rã joint, ΔlogL_RC≈1065, chiếm khoảng 80%); điều này có thể hiểu là cải thiện vừa phải khoảng Δχ²≈0.90 trên mỗi điểm trong N=2295 điểm dữ liệu RC, dưới likelihood Gaussian đường chéo, tự nhiên tích lũy thành ưu thế bậc 10^3. Đồng thời, GGL và kiểm định đóng kín cung cấp ràng buộc xuyên bộ dữ liệu độc lập, và thứ hạng vẫn ổn định dưới các phép thử áp lực σ_int, R_min và cov-shrink (xem Mục 6 và Bảng S1b).
5.2 Kết quả kiểm định đóng kín (RC-only → GGL)
Đại lượng then chốt của kiểm định đóng kín ΔlogL_closure được trình bày trong Bảng S1b và Hình S3. Họ EFT có cường độ đóng kín 171.977–280.513, cao hơn 126.678 của DM_RAZOR. Điều này có nghĩa là: khi không cho phép bất kỳ bậc tự do xuyên dữ liệu bổ sung nào, các mẫu hậu nghiệm mà EFT thu được từ dữ liệu RC có năng lực dự đoán chuyển giao mạnh hơn đối với dữ liệu GGL.
Đối chứng âm tiếp tục ủng hộ tính liên quan vật lý của tín hiệu đóng kín: khi nhóm RC-bin→GGL-bin bị xáo trộn ngẫu nhiên, cường độ đóng kín của EFT giảm xuống 6–15 (các nhân khác nhau có sai khác nhỏ), trong khi cường độ đóng kín gốc cao tới 172–281. Sự “sụp đổ tín hiệu” này loại trừ các ưu thế giả do triển khai số, lỗi đơn vị hoặc xử lý hiệp phương sai không đúng.

Hình R1 | Đối chứng âm: sau khi xáo trộn nhóm, tín hiệu đóng kín giảm đáng kể (vẽ theo chỉ số Tab_Z1).
5.3 Ý nghĩa và giới hạn của kết quả
Kết luận của nghiên cứu này là “trong bộ dữ liệu và giao thức này, hiệu chỉnh hấp dẫn trung bình EFT vượt trội so với đường chuẩn DM_RAZOR được kiểm thử”. Cần nhấn mạnh rằng phía DM chỉ dùng đường chuẩn NFW tối thiểu với quan hệ c(M) cố định, chưa đưa vào các mô hình như core hóa, phi cầu, hạng môi trường hay liên kết thiên hà–hào quang phức tạp hơn. Vì vậy, bản thảo này không tuyên bố loại trừ toàn bộ họ mô hình DM; thay vào đó, nó cung cấp một đường chuẩn đối chứng có thể tái lập, lấy kiểm định đóng kín làm trung tâm, để đánh giá liệu RC và GGL có thể được giải thích nhất quán bằng cùng các tham số xuyên dữ liệu và cùng ánh xạ hay không.
Để đáp lại mối lo thường gặp này, chúng tôi đã hoàn tất một dự án mở rộng độc lập P1A (xem Phụ lục B). Không thay đổi ánh xạ chung RC-bin→GGL-bin hay khung kiểm toán, dự án này tăng cường đường chuẩn DM theo cách “chuẩn hóa và có thể kiểm toán”: ngoài ba tăng cường một tham số (SCAT/AC/FB), nó bổ sung (i) c–M scatter phân cấp + tiên nghiệm khối lượng–nồng độ (DM_HIER_CMSCAT), (ii) proxy core baryonic-feedback một tham số (DM_CORE1P), và (iii) tham số nuisance m cho shear-calibration phía thấu kính yếu (DM_RAZOR_M), đồng thời báo cáo mô hình tổ hợp DM_STD; EFT_BIN được giữ làm đối chứng tham chiếu.
• DM_RAZOR_SCAT (c–M scatter) — đưa vào tham số độ tán nồng độ giữa các halo σ_logc để kiểm tra liệu c(M) cố định có đánh giá thấp có hệ thống sức giải thích của DM hay không;
• DM_RAZOR_AC (Adiabatic Contraction) — dùng một tham số α_AC để nội suy liên tục giữa “không co lại” và “co lại tiêu chuẩn”, nắm bắt xu hướng baryon làm hào quang trong co lại với chi phí tối thiểu;
• DM_RAZOR_FB (Feedback/core) — dùng một thang core (ví dụ log r_core) để mô tả việc hình thành core trong vùng trong làm suy giảm đường cong quay, đồng thời vẫn giữ xấp xỉ NFW ở thang thấu kính yếu.
Scoreboard định lượng P1A được đưa trong Phụ lục B, Bảng B1 / Hình B1 (tự động tạo từ Tab_S1_P1A_scoreboard). Ở chỉ số đóng kín, DM_RAZOR_FB cho một cải thiện ròng nhỏ (122.21→129.45, +7.25), trong khi các tăng cường khác đóng góp không đáng kể hoặc âm cho cường độ đóng kín. Ở phía khớp chung, thêm tiên nghiệm c–M scatter phân cấp (DM_HIER_CMSCAT) hoặc mô hình tổ hợp (DM_STD) có thể cải thiện đáng kể joint logL, nhưng không cải thiện cường độ đóng kín, gợi ý rằng nó chủ yếu bổ sung độ linh hoạt cho khớp chung chứ không tăng khả năng chuyển giao xuyên đầu dò. Vì vậy, kết luận cốt lõi của phần chính nên được đọc như sau: dưới ràng buộc ánh xạ chung nghiêm ngặt và kiểm định đóng kín, ưu thế nhất quán xuyên dữ liệu của EFT không đến từ việc chọn một đường chuẩn DM “quá yếu”. Gói phát hành P1A tương ứng với Phụ lục B (bảng/hình bổ sung và full_fit_runpack) sẽ được đưa vào dưới dạng tệp bổ sung trong cùng Zenodo Concept DOI với full_fit_runpack của bài này: https://doi.org/10.5281/zenodo.18526286.
6 Độ vững và thí nghiệm đối chứng
6.1 Quét σ_int (Run-5)
Chúng tôi quét có hệ thống độ tán nội tại RC σ_int và lặp lại suy luận chung tại mỗi σ_int, tính ΔlogL_total so với DM_RAZOR. Các giá trị nhỏ nhất/lớn nhất của ΔlogL_total cho từng mô hình trong khoảng quét được báo cáo trong Bảng S1b.

Hình R2 | Khoảng ΔlogL_total dưới quét σ_int (càng lớn càng tốt).
6.2 Quét R_min (Run-6)
Để kiểm tra tác động của các hệ thống sai số ở dữ liệu vùng trung tâm (như chuyển động không tròn, độ phân giải và mô hình baryon chưa đủ), chúng tôi áp dụng các ngưỡng cắt R_min cho RC và lặp lại suy luận chung. Dưới quét R_min, ưu thế của họ EFT vẫn dương và ổn định về thang độ lớn.

Hình R3 | Khoảng ΔlogL_total dưới quét R_min (càng lớn càng tốt).
6.3 Quét cov-shrink (Run-7)
Để kiểm tra độ bất định của hiệp phương sai GGL, chúng tôi áp dụng shrinkage cho ma trận hiệp phương sai của mỗi bin khối lượng: C_α=(1−α)C+α·diag(C), rồi quét α. Kết quả cho thấy ưu thế của họ EFT không nhạy với cách xử lý này.

Hình R4 | Khoảng ΔlogL_total dưới quét cov-shrink (càng lớn càng tốt).
6.4 Thang tiêu biến (Run-8)
Bên trong EFT_BIN, chúng tôi thực hiện tiêu biến lồng nhau: từ mô hình cực giản (không tham số tự do), tới các phiên bản chỉ giữ một số ít bậc tự do, rồi đến mô hình hoàn chỉnh 20-bin biên độ + thang toàn cục. AICc/BIC cho thấy mô hình EFT_BIN hoàn chỉnh là rất cần thiết để giải thích dữ liệu.

Hình R5 | Thang tiêu biến của EFT_BIN (AICc, càng nhỏ càng tốt).
6.5 Dự đoán giữ lại (Run-9)
Chúng tôi tiếp tục thực hiện kiểm định leave-one-bin-out (LOO): trong 4 bin khối lượng GGL, mỗi lần giữ lại 1 bin; suy luận được chạy lại với các bin còn lại (và toàn bộ RC), rồi log-likelihood kiểm thử được đánh giá trên bin giữ lại. Các chỉ số tổng hợp được trình bày trong bảng bổ sung Tab_R3_leave_one_bin_out (sản phẩm Run-9; mẫu đường dẫn tệp được liệt kê trong danh sách sản phẩm then chốt ở Mục 8.2). Họ EFT vẫn vượt trội rõ rệt so với DM_RAZOR ngay cả trong trường hợp giữ lại xấu nhất.

Hình R6 | LOO: phân bố log-likelihood của bin giữ lại (từ sản phẩm Run-9).
6.6 Đối chứng âm: RC-bin shuffle (Run-10)
Run-10 xáo trộn ngẫu nhiên 20 RC-bin thành 4×5 và tính lại đóng kín trong khi giữ nguyên hậu nghiệm RC-only. Kết quả cho thấy: so với ánh xạ gốc, shuffle làm giảm đáng kể cả mean logL_true của đóng kín và ΔlogL_closure (xem Bảng S1b và Hình R1), tiếp tục ủng hộ khả năng diễn giải của tín hiệu đóng kín.

Hình R7 | Đối chứng âm: ánh xạ shuffle làm mean logL_true của đóng kín giảm rõ rệt (từ sản phẩm Run-10).
7 Khả năng truy vết và kiểm toán nhất quán (Provenance)
Tất cả các giá trị số được trích dẫn trong bài này đều có thể truy vết từng mục trong các bảng tổng hợp nghiêm ngặt và bản ghi kiểm toán của kho lưu trữ phát hành. Để phần chính dễ đọc hơn, toàn bộ chuỗi provenance (danh sách tag, bảng kiểm toán, danh sách checksum và phương pháp kiểm tra) đã được chuyển sang Phụ lục A.
8 Khả năng tái lập và lưu trữ Zenodo
Tuyên bố về khả dụng dữ liệu và mã: dữ liệu đường cong quay SPARC và dữ liệu thấu kính yếu KiDS-1000 dùng trong bài này đều là dữ liệu công khai. Báo cáo cấp công bố đã được lưu trữ trên Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), và gói tái lập đầy đủ đã được lưu trữ trên Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Các bước thực thi chi tiết, môi trường phụ thuộc, danh mục lưu trữ và thông tin kiểm tra hash được cung cấp trong Phụ lục A; thiết kế, nhãn chạy và đầu ra của phép thử áp lực chuẩn hóa đường chuẩn DM (P1A) được cung cấp trong Phụ lục B.
Dưới cùng Concept DOI của gói tái lập đầy đủ (https://doi.org/10.5281/zenodo.18526286), chúng tôi cung cấp hai lối vào tái lập theo mục đích sử dụng: • P1 (phần chính) full_fit_runpack: tái lập RC-only / closure / joint và các quét độ vững cho EFT vs DM_RAZOR, đồng thời tạo các tài sản phần chính như Bảng S1a/S1b và Hình S3/S4; • P1A (Phụ lục B) full_fit_runpack: tái lập phép thử áp lực chuẩn hóa đường chuẩn DM (SCAT/AC/FB + prior c–M scatter phân cấp + core1p + lensing m + DM_STD; có đối chứng EFT_BIN), đồng thời tạo Bảng B1 và Hình B1 của Phụ lục. Các bảng/hình bổ sung và full_fit_runpack của P1A sẽ được đưa vào như tệp bổ sung dưới cùng Concept DOI để giữ một lối vào lưu trữ thống nhất.
9 Lời cảm ơn và tuyên bố
9.1 Lời cảm ơn
Chúng tôi cảm ơn các nhóm SPARC và KiDS-1000 đã cung cấp dữ liệu cùng tài liệu công khai; cảm ơn những người tham gia vào quy trình tái dựng và kiểm toán của dự án này.
9.2 Đóng góp của tác giả
Guanglin Tu chịu trách nhiệm về đề xuất khái niệm, thiết kế phương án, triển khai kỹ thuật, xử lý dữ liệu, phân tích hình thức, hiện thực hóa và kiểm toán quy trình tái lập, cũng như viết bản thảo.
9.3 Nguồn kinh phí
Tác giả Guanglin Tu tự tài trợ cá nhân (không có tài trợ bên ngoài / không có mã quỹ).
9.4 Lợi ích cạnh tranh
Tác giả Guanglin Tu có liên hệ với “Nhóm Công tác EFT, Công ty TNHH Nghiên cứu Khoa học Sợi Năng lượng Thâm Quyến (Trung Quốc)”; không có lợi ích cạnh tranh nào khác.
9.5 Hỗ trợ AI
OpenAI GPT-5.2 Pro và Gemini 3 Pro được dùng để trau chuốt ngôn ngữ, biên tập cấu trúc và sắp xếp quy trình tái lập; không được dùng để tạo hoặc chỉnh sửa dữ liệu, kết quả, hình, bảng hay mã; cũng không được dùng để tạo trích dẫn. Tác giả chịu toàn bộ trách nhiệm về nội dung và độ chính xác của trích dẫn trong toàn văn.
10 Tài liệu tham khảo
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
- Thuyết Sợi Năng Lượng. Zenodo (kho lưu trữ khoa học mở) DOI: https://doi.org/10.5281/zenodo.18517411
Phụ lục A: Chi tiết về khả năng truy vết và tái lập
Phụ lục này tổng hợp thông tin dùng cho lưu trữ dài hạn về khả năng truy vết và tái lập (nhãn chạy, kết quả kiểm toán, danh mục lưu trữ và các điểm kiểm tra then chốt), để độc giả có thể kiểm tra và tái lập khi cần.
A.1 Chi tiết truy vết và kiểm toán
Để bảo đảm khả năng truy vết dài hạn, dự án này dùng tag thời gian cho mỗi lần chạy và mỗi đầu ra, đồng thời giữ lại sản phẩm lịch sử mà không ghi đè. Các giá trị cốt lõi được trích dẫn trong bản thảo này đến từ tổng hợp nghiêm ngặt (compile_tag=20260205_035929), và đã vượt qua các kiểm toán nhất quán sau:
• Mọi bảng theo giai đoạn đều mang run_tag và tag giai đoạn; script tổng hợp nghiêm ngặt chọn nguồn bảng canonical “đầy đủ và nhất quán” từ report/tables.
• Các giá trị trong Tab_Z1_master_summary và Tab_Z2_conclusion_highlights được đối chiếu từng mục với các bảng canonical đã chọn.
• Khi tạo PDF, kiểm toán tag được thực hiện đối với “tag của bảng/hình được trích dẫn” để bảo đảm không trộn lẫn sản phẩm cũ.
Các tag then chốt (để định vị toàn bộ sản phẩm trung gian): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.
Kết quả kiểm toán nhất quán: Tab_AUDIT_checks_strict hiển thị pass=9, fail=0, skip=0 (xem chi tiết trong gói release).
A.2 Các bước thực thi tái lập và danh mục lưu trữ
Nghiên cứu này dùng hệ thống tái lập gồm “báo cáo cấp công bố + bổ sung bảng/hình + gói chạy lại toàn phần”. Độc giả có thể trực tiếp tra Tables & Figures Supplement để kiểm tra toàn bộ tài sản bảng/hình được trích dẫn trong bài; nếu cần tái lập số liệu và chuỗi kiểm toán từ đầu, có thể dùng full_fit_runpack để tải dữ liệu và chạy lại toàn bộ quy trình. Sau khi chạy xong, script so sánh bảng tham chiếu tích hợp trong gói có thể dùng để xác minh tính nhất quán của giá trị trong bảng.
A.2.1 Quickstart tái lập (RUN_FULL, Windows PowerShell)
Mục này đưa ra một lộ trình tái lập ngắn hơn (Windows PowerShell). Để kiểm tra nhanh, khuyến nghị đọc trực tiếp Tables & Figures Supplement và đối chiếu từng bảng, từng hình được trích dẫn. Nếu cần tái lập đầu-cuối và tạo toàn bộ bảng, hình cùng sản phẩm kiểm toán, hãy dùng full_fit_runpack: thực hiện verify_checksums.ps1 và RUN_FULL.ps1 theo README/ONE_PAGE_REPRO_CHECKLIST trong gói (khuyến nghị Mode=full).
Lối vào lưu trữ Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Các tag chuỗi chính của bài này: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag=20260205_112442.
A.2.2 Vật liệu lưu trữ và điểm kiểm tra then chốt (Packages & checks)
Kho lưu trữ Zenodo cung cấp 3 loại vật liệu bổ sung cho nhau: (1) báo cáo cấp công bố (bài này, v1.1; gồm Phụ lục B: phép thử áp lực chuẩn hóa đường chuẩn DM P1A); (2) Tables & Figures Supplement (bổ sung bảng và hình: bao phủ toàn bộ tài sản bảng/hình được trích dẫn trong bài này; tương ứng riêng cho P1 và P1A); (3) full_fit_runpack (gói tái lập đầy đủ: tải dữ liệu từ đầu và chạy lại toàn bộ quy trình; tương ứng riêng cho P1 và P1A). Trong đó (1)–(2) hỗ trợ đọc nhanh và kiểm tra độc lập, còn (3) cung cấp khả năng tái lập đầy đủ đầu-cuối.
Loại vật liệu | Tên tệp (ví dụ) | Mục đích và định vị (khuyến nghị dùng theo thứ tự này) |
Báo cáo cấp công bố (tiếng Trung và tiếng Anh) | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | Báo cáo hoàn chỉnh được lưu trữ trên Zenodo; phần chính đưa ra kết luận cốt lõi và kiểm toán độ vững, Phụ lục B đưa ra P1A (kiểm thử áp lực chuẩn hóa đường chuẩn DM). |
Tables & Figures Supplement (P1) | P1_RC_GGL_supplement_figs_tables_V1_1.zip | Toàn bộ bảng (CSV) và hình (PNG) được trích dẫn trong phần chính, bao gồm script tạo và tệp tag. |
Tables & Figures Supplement (P1A) | P1A_supplement_figs_tables_v1.zip | Toàn bộ bảng và hình được trích dẫn trong Phụ lục B (P1A), bao gồm Tab_S1_P1A_scoreboard và Fig_S1_P1A_scoreboard. |
full_fit_runpack (P1) | P1_RC_GGL_full_fit_runpack_v1_1.zip | Tái lập đầy đủ đầu-cuối: tải dữ liệu từ đầu và chạy lại RC-only/closure/joint cùng các quét độ vững. |
full_fit_runpack (P1A) | P1A_RC_GGL_full_fit_runpack_v1.zip | Tái lập đầy đủ đầu-cuối (Phụ lục B): chạy lại DM 7+1 + DM_STD (có đối chứng EFT_BIN) và tạo tài sản phụ lục; gói có script so sánh bảng tham chiếu để xác minh tính nhất quán của giá trị bảng. |
Khuyến nghị trích dẫn: khi trích dẫn bài này hoặc các vật liệu tái lập đi kèm, vui lòng ghi Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).
Các sản phẩm then chốt cần xuất hiện và có thể so sánh sau khi tái lập gồm:
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (tổng hợp đóng kín)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (tổng hợp khớp chung)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (quét σ_int)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (quét R_min)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (quét cov-shrink)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (tiêu biến)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (đối chứng âm)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (bảng chính Strict; tương ứng với Bảng S1a/S1b và các giá trị trong phần chính)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (bản PDF tổng hợp cấp công bố; có thể dùng để xem nhanh và trích dẫn)
Phụ lục B: P1A — Kiểm thử áp lực chuẩn hóa đường chuẩn DM (DM 7+1 + DM_STD; có đối chứng EFT)
Phụ lục này ghi lại một dự án mở rộng “kiểm thử áp lực chuẩn hóa đường chuẩn DM” (P1A) nhất quán với giao thức đóng kín trong phần chính. Định vị của nó là: không đưa vào số lượng lớn bậc tự do, không thay đổi ánh xạ chung RC-bin→GGL-bin hay khung kiểm toán, nhưng nâng đường chuẩn DM_RAZOR tối thiểu được dùng trong phần chính (NFW + c–M cố định, không scatter / không co lại / không core) thành một tập đường chuẩn DM gần hơn với thực hành thiên văn vật lý và chống chịu tốt hơn trước các chất vấn thường gặp. P1A bao phủ và là siêu tập của phép thử áp lực ba nhánh trước đó: giữ SCAT/AC/FB, đồng thời thêm c–M scatter phân cấp + prior, proxy core một tham số và tham số nuisance shear-calibration m phía thấu kính; ngoài ra còn cung cấp mô hình tổ hợp DM_STD. EFT_BIN được giữ làm tham chiếu đối chứng.
Ghi chú bổ sung: các giá trị như cường độ đóng kín trong Phụ lục B (P1A) dùng ngân sách Monte Carlo cao hơn (ví dụ ndraw=400, nperm=24), khác với ngân sách quick trong phần chính dùng để bao phủ toàn bộ họ nhân EFT (ví dụ ndraw=60, nperm=12). Vì vậy, giá trị tuyệt đối có thể có trôi mẫu bậc O(10); nhưng so sánh giữa các mô hình trong cùng ngân sách/cùng bảng là công bằng, và dấu cùng bậc độ lớn của ưu thế vẫn ổn định giữa các ngân sách.
B.1 Mục đích và định vị (Tại sao P1A, và tại sao đặt trong phụ lục)
P1A không cố gắng vét cạn mọi khả năng mô hình hóa hào quang ΛCDM (ví dụ phi cầu, phụ thuộc môi trường, kết nối thiên hà–hào quang phức tạp hay baryon physics số chiều cao). Ngược lại, P1A áp dụng nguyên tắc “ít chiều, có thể kiểm toán, có thể tái lập”: mỗi mô-đun tăng cường chỉ đưa vào ≤1 tham số hiệu dụng then chốt, và tiếp tục chấp nhận ba ràng buộc cứng của bài này:
(i) Sổ cái tham số: tham số mới phải được ghi sổ rõ ràng và báo cáo cùng các tiêu chuẩn thông tin (AICc/BIC);
(ii) Ánh xạ chung: vẫn dùng cùng ánh xạ nhóm RC-bin→GGL-bin, không cho phép “chỉnh ánh xạ” riêng cho một bộ dữ liệu đơn lẻ;
(iii) Kiểm định đóng kín: mọi tăng cường phải thể hiện lợi ích thật trong dự đoán chuyển giao RC→GGL, chứ không chỉ cải thiện khớp RC-only.
B.2 DM 7+1 + DM_STD: định nghĩa mô-đun, tham số và cách đi vào hậu nghiệm chung
P1A, như một runpack độc lập, cung cấp 8 workspace DM (DM 7+1) và 1 đối chứng EFT: bắt đầu từ đường chuẩn DM_RAZOR, xây dựng ba tăng cường legacy một tham số (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), đồng thời bổ sung ba mô-đun phòng vệ tiêu chuẩn hơn (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), rồi đưa ra mô hình tổ hợp DM_STD. Mục tiêu chung của các mô-đun này là: trong điều kiện tăng số chiều càng ít càng tốt, bao phủ ba loại chất vấn thường gặp nhất: (a) độ tán của quan hệ c–M và tiên nghiệm đi vào mô hình phân cấp như thế nào; (b) hiệu ứng chính của baryonic feedback có thể được proxy core một tham số nắm bắt hay không; (c) hệ thống sai số then chốt phía thấu kính có thể bị nhầm thành tín hiệu vật lý hay không.
Workspace | dm_model | Tham số mới (≤1) | Động cơ vật lý (cốt lõi) | Nguyên tắc triển khai (thân thiện kiểm toán) |
|---|---|---|---|---|
DM_RAZOR | NFW (fixed c–M, no scatter) | — | Đường chuẩn hào quang ΛCDM tối thiểu, có thể kiểm toán; dùng để so sánh nghiêm ngặt với EFT | Ánh xạ chung cố định; sổ cái tham số nghiêm ngặt; chỉ dùng baseline cho so sánh tương đối |
DM_RAZOR_SCAT | NFW + c–M scatter(legacy) | σ_logc | Quan hệ c–M có độ tán; xấp xỉ bằng scatter log-normal một tham số | ≤1 tham số mới; giữ ánh xạ chung; lấy lợi ích đóng kín làm tiêu chí chấp nhận |
DM_RAZOR_AC | NFW + Adiabatic Contraction(legacy) | α_AC | Baryon rơi vào có thể gây co lại đoạn nhiệt của halo; xấp xỉ bằng cường độ một tham số | ≤1 tham số mới; không đổi ánh xạ; báo cáo thay đổi AICc/BIC và lợi ích đóng kín |
DM_RAZOR_FB | NFW + feedback core(legacy) | log r_core | Feedback có thể hình thành core ở vùng trong; xấp xỉ bằng thang core một tham số | ≤1 tham số mới; cùng giao thức đóng kín/đối chứng âm; cải thiện RC-only không phải mục tiêu duy nhất |
DM_HIER_CMSCAT | Hierarchical c–M scatter + prior | σ_logc(hier) | c_i∼logN(c(M_i),σ_logc) phân cấp tiêu chuẩn hơn; ảnh hưởng đồng thời đến hậu nghiệm chung của RC và GGL | Prior hiển thị rõ; biên hóa latent c_i; vẫn giữ ít chiều và có thể kiểm toán |
DM_CORE1P | 1‑parameter core proxy (coreNFW/DC14‑inspired) | log r_core | Dùng proxy core một tham số cho hiệu ứng chính của baryonic feedback, tránh chi tiết hình thành sao số chiều cao | Trích dẫn tài liệu chuẩn; ≤1 tham số mới; gắn với kiểm định đóng kín |
DM_RAZOR_M | NFW + lensing shear‑calibration nuisance | m_shear(GGL) | Hấp thụ hệ thống sai số then chốt phía thấu kính yếu bằng một tham số hiệu dụng, giảm rủi ro “nhầm hệ thống sai số thành vật lý” | Nuisance được ghi sổ rõ; không được tác động ngược tới RC; kết quả chủ yếu xét theo độ vững đóng kín |
DM_STD | Standardized DM baseline (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Đưa ba lớp chất vấn thường gặp nhất vào cùng một đường chuẩn tiêu chuẩn vẫn ít chiều | Báo cáo đồng thời sổ cái tham số + tiêu chuẩn thông tin; đóng kín là chỉ số chính; dùng làm đối chứng phòng vệ DM mạnh nhất |
Ghi chú: các tên tham số trên lấy theo triển khai kỹ thuật (ví dụ σ_logc, α_AC, log r_core, m_shear). Trọng tâm thiết kế của P1A là “làm đường chuẩn DM mạnh hơn một chút nhưng vẫn có thể kiểm toán”, chứ không biến phía DM thành một máy khớp số chiều cao không kiểm soát. Đặc biệt, DM_HIER_CMSCAT đưa c–M scatter vào theo kiểu phân cấp: nồng độ c_i của mỗi halo được đặt với độ tán log-normal quanh c(M_i), và bị ràng buộc thông qua σ_logc toàn cục cùng tiên nghiệm c(M); cấu trúc phân cấp này đồng thời ảnh hưởng tới hậu nghiệm chung của RC và GGL.
B.3 Giao thức thống kê và quy cách sản phẩm nhất quán với phần chính
P1A tái sử dụng toàn bộ sản phẩm dữ liệu, ánh xạ chung và khung kiểm toán của phần chính; trình tự thực thi và quy cách sản phẩm giữ nhất quán:
(1) Run‑1: suy luận RC-only (xuất posterior_samples.npz và metrics.json);
(2) Run‑2: kiểm định đóng kín RC→GGL (xuất closure_summary.json và permuted baseline);
(3) Run‑3: khớp chung RC+GGL (xuất joint_summary.json).
Mọi con số được trích dẫn đều đến từ bảng tổng hợp tự động (Tab_S1_P1A_scoreboard), và có thể được kiểm tra lại bằng script so sánh bảng reference tích hợp trong P1A full_fit_runpack sau khi chạy lại toàn bộ quy trình.
B.4 Kết quả chính, lối vào bảng/hình và kế hoạch lưu trữ (cùng DOI)
Mục này đưa ra các kết luận định lượng cốt lõi của P1A. Bảng B1 tổng hợp các chỉ số then chốt cho RC-only, đóng kín RC→GGL và khớp chung RC+GGL (giá trị trong ngoặc là chênh lệch so với DM_RAZOR baseline); cường độ đóng kín được định nghĩa là ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (càng lớn càng tốt). Hình B1 trực quan hóa cùng scoreboard. Các điểm kết luận như sau:
• trong ba nhánh legacy, chỉ DM_RAZOR_FB (feedback/core) đem lại mức tăng ròng nhỏ cho cường độ đóng kín: 122.21→129.45 (+7.25); SCAT và AC không có tăng ròng;
• DM_HIER_CMSCAT và DM_RAZOR_M mới thêm có ảnh hưởng rất nhỏ (~0) đến cường độ đóng kín, DM_CORE1P cũng không cho thấy tăng ròng đáng kể;
• mô hình tổ hợp DM_STD có thể cải thiện rõ rệt joint logL (gần tối ưu khớp chung hơn), nhưng cường độ đóng kín lại giảm, gợi ý rằng cải thiện chủ yếu đến từ độ linh hoạt khớp chung chứ không phải khả năng chuyển giao xuyên đầu dò;
• EFT_BIN, với tư cách đối chứng, vẫn giữ ưu thế rõ rệt về cả cường độ đóng kín và khớp chung. Do đó, kết luận chính của phần thân bài vững trước việc đưa vào “đường chuẩn DM mạnh hơn + nuisance thấu kính”.
Để đối chiếu trực tiếp với so sánh chính trong phần thân bài, Bảng S1a–S1b tóm tắt kết quả đối chứng nghiêm ngặt giữa họ EFT và DM_RAZOR: các mô hình EFT nâng ΔlogL_total≈1155–1337 so với DM_RAZOR trong phép khớp chung, và đạt ΔlogL_closure=172–281 trong kiểm định đóng kín; P1A chỉ thực hiện một “đối chứng khó hơn” ở phía DM, với tác dụng giảm các chất vấn kiểu “strawman baseline / systematics-as-physics”, chứ không thay thế so sánh chính của phần thân bài.
Bảng B1 | P1A scoreboard (càng lớn càng tốt; ngoặc là chênh lệch so với DM_RAZOR baseline).
Nhánh mô hình (workspace) | Δk | RC-only best logL_RC (Δ) | Cường độ đóng kín ΔlogL_closure (Δ) | Joint best logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Hình B1 | P1A scoreboard: ΔlogL của đóng kín và khớp chung so với baseline (càng lớn càng tốt).

Một nhóm chạy ví dụ đã hoàn tất tương ứng với phụ lục này như sau (để định vị sản phẩm trung gian và bảng/hình P1A):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.
B.5 Cách trích dẫn khuyến nghị (Appendix citation note)
Khi độc giả cần trích dẫn “kiểm thử áp lực chuẩn hóa đường chuẩn DM” ngoài kết luận chính, nên trích dẫn kết luận chính đồng thời thêm ghi chú: ‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’