Nature Astronomy 發問：幾百年前的數據還好使嗎？

——好使，但是要謹慎使用

在太陽乃至天文學的研究中，時間尺度是個非常重要的概念。時間尺度決定了在研究中需要關注什麼物理量和物理現象。

不同的研究對象也對應了不同的時間尺度

耀斑
能量釋放過程的時間尺度是秒到分鐘

[ref Helioviewer.org]

日冕物質拋射穿過日冕
的時間尺度是小時到天

[ref: National Aeronautics and Space Administration]

黑子的平均生命周期是兩周

太陽自轉周期大概是一個月

太陽活躍程度有11年的周期

[ref : Wikipedia : solar maximum]

我們現在（2019年）正處於第24個太陽周的末尾的太陽平靜期。

更長期的，不同太陽活動周之間太陽的活躍度也有差異

[CC BY-SA 3.0, File:Sunspot Numbers.png]

比如著名的Maunder極小期，在1645到1715年這幾十年里，太陽黑子數非常非常低。

[ref: Wikipedia : maunder minimum]

這種現象讓學者猜測，太陽活動是否存在比11年更長的周期。

在研究太陽的超長周期的時候，當然需要把過去幾百年的數據整合起來去分析變化趨勢。

問題來了，把幾百年前的數據和現在的黑子數據放在一起，這種跨越世紀的數據對比是有意義的嗎？結果可信度有多大？

這個問題，登上了Nature Astronomy的封面。

Nature Astronomy 把官推頭像都換成了這張圖

原文地址：Visualization of the challenges and limitations of the long-term sunspot number record

這篇文章中提出了導致結果不可信的來源：

（1）望遠鏡不同，觀測者不同，可能會導致最終觀結果測差異很大。因為科技在發展，我們現在已經可以做到精度為0.5角秒的完全不間斷的全日面觀測，而幾百年前，只有肉眼和光學透鏡。畢竟1960之後才有可以用於科研的計算機。

（2）使用古老數據的另外一個問題是同一個觀測者的洞察力也是隨時間變化的，尤其是在使用肉眼望遠鏡的年代，隨著觀測者的衰老，視力觀測時長等因素會影響觀測結果。

（3）人對事件的認知也在發生變化。

（4）缺少均勻而連續的觀測，這個問題在現代觀測中幾乎不存在，就像SDO衛星，24小時都能看見太陽，能一直做不間斷觀測。老數據中會出現由於觀測者的缺席等不可抗拒因素造成的數據不連續。

（5）對於事件強弱的認證困難，因為老數據中不包含絕對定標。

在文章中，作者給出了一個太陽黑子觀測的例子：

圖左是400年前對於黑子的記錄，圖右是現在對於黑子的觀測。

圖左在一幅圖上畫出了黑子演化的過程，記錄標明黑子從多個黑子群合併成一個黑子群。如圖右也是黑子群，但是很難說這到代市一個黑子群還是兩個黑子群。

這就是問題之一：我們很難定義分多開的兩個黑子群算是兩個黑子群？白光觀測中的多大的黑斑算是一個黑子？黑子中有多少次級結構能算是一個黑子群？其實這些都是模稜兩可的問題，存在很大的主觀性。

只要評判標準存在主觀性，那麼結果唯一性就會受到影響

雖然當代觀測面臨這樣的定義邊界模糊的問題，由於觀測設備優秀，觀測者多，所以得到的觀測結果一致性很高。

把能找到的所有觀測都匯總起來看：

圖a是不同科學家觀測的太陽黑子群的數量，圖b中一個黑點表示一個觀測，連線表示觀測的相互印證。

圖中可以看出來這400年的觀測里，前200年可以相互印證的觀測很少，而且大家觀測的差異比較大，線圖給出的結果比較不統一。從1850年開始，可以相互印證的觀測開始明顯增多，不同觀測者的結果也比較統一。

如果但看後面這一段，並沒有很強的周期性，太陽黑子數相對比較穩定。

從另外一個角度看：數據的時間覆蓋率

連續時間序列分析中，觀測時間覆蓋率非常重要。觀測時間覆蓋率越高，結果就越可信。現在的觀測可以做到完全連續觀測，因為全球都有觀測站，而且還有可以持續觀測的觀測衛星。而老數據的時間覆蓋率就很差了

這也是我們需要小心使用老數據的一個重要原因

Nature-Astronomy中這篇文章對於觀測的時間覆蓋率也做了分析。

可以看出對於位置的記載在1820年之後才出現連續的覆蓋率超過20%的觀測，在此之前的絕大多數年份有記載的數據覆蓋率不超過5%。

從這些角度來看待這400年的黑子數據就可以很直觀的看出哪些數據是可信的，哪些數據是不可信的。這個太陽黑子的例子給科研者提供了一個很好的數據展示典範，很少有科研者能做到這件事，就是告訴大家自己所用的數據裡面哪些是更可信的，哪些是值得懷疑的，並在數據上把衡量可信度的指標標記上去。

在實際的科研中，其實經常會遇到類似需要組合數據聯合觀測的手段，需要把很多觀測資料組合起來去解釋一個物理現象。這個時候就需要非常小心。

把不同時間不同儀器觀測的同一個物理量的時間序列用於分析的時候，要時刻自己明白哪些數據是更可信的，同時在工作總結和文章的時候也有義務讓讀者了解不同部分數據的可信度。

題外話：

在自己需要定判定標準的時候，要盡量避免主觀成分。

比如定一個閾值來決定白光全日面觀測中多大黑斑算一個黑子這個問題。就像定一個閾值來劃分問有多根少頭髮算禿子，多少根頭髮算烏黑濃密一樣（扎心了）。

從這個角度看，用亮度離群值總面積比數黑子數來表徵活躍度應該更合適一些。

=========

Pjer內容分類：

精選射電編程科研工具太陽物理