• 什麼推動了名人漲粉?語言使用還是社交連接;
  • 用於推薦的動態圖中的鏈路預測;
  • 多智能體強化學習中語言學習慣的湧現;
  • 深入瞭解匿名:對Quora問題的大規模分析;
  • 再現科學家的流動性:數據驅動的模型;
  • 用於實際系統的基於拓撲和優化的通用網路恢復;
  • 社會網路上意見形成的Ising-PageRank模型;
  • 用精英集團探索小世界網路:將嵌入理論引入風險投資網路的動態演化;
  • 眾包平臺的貢獻者資料模型化;
  • 屬性網路的離羣感知網路嵌入;
  • Twitter上基於影響的聚類模型;
  • 城市系統的空間測度:從熵到分形維數;
  • 非法過馬路中的不確定行為;
  • 綜合社會聯繫網路複雜性與現實性的實證評估;
  • 超圖的Forman-Ricci曲率;
  • 誇大的新聞內容在社交媒體的傳播特徵;
  • 論網路可見性問題;

什麼推動了名人漲粉?語言使用還是社交連接

原文標題: What Propels Celebrity Follower Counts? Language Use or Social Connectivity

地址: arxiv.org/abs/1811.0716

作者: Jasabanta Patro, Rameshwar Bhaskaran, Animesh Mukherjee

摘要: 追隨者數量是量化名人受歡迎程度的因素。它反映了他們的力量,聲望和整體社會影響力。在本文中,我們調查社交連接或語言選擇是否與名人的未來追隨者數量更相關。我們通過經過驗證的Twitter帳戶收集有關471名印度名人的推文,轉推和提及的數據。我們建立了兩個新的網路來近似名人的社交連接。我們研究了這兩個網路的各種結構特性,並觀察它們與未來跟隨者數量的相關性。同時,我們分析推文的語言結構(LIWC特徵,語法和情感特徵以及風格和可讀性特徵),並觀察每個推文與名人未來追隨者數量的相關性。作為最後一步,我們使用這些功能對未來追隨者數量(HIGH,MID或LOW)的特定桶中的名人進行分類。我們觀察到單獨的網路特徵實現了0.52的準確度,而單獨的語言特徵實現了0.69的準確度,遠遠超過網路特徵。網路和語言特徵結合起來產生0.76的準確度。我們還討論了一些最終的見解,我們從進一步的數據分析中得到了更多關注者數量的名人,這些推文包括(i)來自朋友和家庭LIWC類別的更多單詞,(ii)更積極的情緒負擔詞,(iii)有更好的語言結構並且(iv)更具可讀性。

用於推薦的動態圖中的鏈路預測

原文標題: Link Prediction in Dynamic Graphs for Recommendation

地址: arxiv.org/abs/1811.0717

作者: Samuel G. Fadel, Ricardo da S. Torres

摘要: 在圖域上使用神經網路的最新進展有助於推動鏈路預測任務中的現有技術,特別是在推薦服務中。然而,在鏈路預測問題中忽略了時間上下文信息的使用,其通常被建模為編碼用戶 - 項目關係隨時間的演變的動態圖。在本文中,我們考慮利用這些信息的假設使模型能夠做出更好的預測,為此提出一種新的神經網路方法。我們在廣泛使用的ML-100k和ML-1M數據集上進行的實驗表明,我們的方法可以在用戶項關係模式隨時間變化的情況下產生更好的預測。此外,他們還認為現有方法會受到這些變化的顯著影響。

多智能體強化學習中語言學習慣的湧現

原文標題: Emergence of linguistic conventions in multi-agent reinforcement learning

地址: arxiv.org/abs/1811.0720

作者: Dorota Lipowska, Adam Lipowski

摘要: 最近,信號傳播慣例的出現,其中語言是一個主要的例子,引起了相當大的跨學科興趣,從博弈論到機器人學到演化語言學。如此廣泛的研究基於不同的假設和方法,但問題的複雜性排除了制定統一和普遍接受的解釋。我們在多智能體強化學習模型的框架中研究信號傳遞約定的形成。當代理之間的交互網路是完整的圖或足夠密集的隨機圖時,通常會達到全球共識,新興語言是幾乎唯一的對象 - 字映射或包含一些同義詞和同音異義詞。在有限維晶格上,模型陷入無序配置,只有局部共識。通過引入種羣更新可以避免這種誘捕,其在存在超線性增強的情況下恢復普通的表面張力驅動的粗化並且顯著增強有效信號的形成。

深入瞭解匿名:對Quora問題的大規模分析

原文標題: Deep Dive into Anonymity: A Large Scale Analysis of Quora Questions

地址: arxiv.org/abs/1811.0722

作者: Binny Mathew, Ritam Dutt, Suman Kalyan Maity, Pawan Goyal, Animesh Mukherjee

摘要: 匿名是我們數字生活中不可或缺的重要組成部分。它使我們能夠在不擔心判斷的情況下表達我們真實的自我。在本文中,我們調查社交問答網站Quora中匿名的不同方面。 Quora的選擇是因為這是一個罕見的社交問答網站之一,允許用戶明確發布匿名問題,這個論壇中的此類活動已成為規範而非禁忌。通過對510萬個問題的分析,我們觀察到,在全球範圍內,匿名和非匿名問題的語言結構幾乎沒有差異。我們發現在全球範圍內局部混合是缺席的主要原因。然而,一旦我們「深入研究」並(局部地)將問題聚類並將具有大量匿名問題的羣集與具有少量匿名問題的羣集進行比較,差異就開始出現。特別是,我們觀察到以匿名方式發布問題的選擇取決於用戶對匿名的看法,他們經常選擇以匿名為幌子談論抑鬱,焦慮,社交關係和個人問題。我們進一步進行人格特質分析,觀察匿名用戶羣與外向性,宜人性和開放性負相關性呈正相關。隨後,為了獲得進一步的見解,我們建立了一個匿名網格,以確定發布問題的用戶和回答問題的用戶社區對匿名感的差異。我們還會查看問題的第一個響應時間,並觀察到討論個人和敏感問題的主題最低,這暗示了更高程度的社區支持和用戶參與度。

再現科學家的流動性:數據驅動的模型

原文標題: Reproducing scientists mobility: A data-driven model

地址: arxiv.org/abs/1811.0722

作者: Giacomo Vaccario, Luca Verginer, Frank Schweitzer

摘要: 本文為理解科學家的流動模式做出了兩個重要貢獻。首先,通過結合兩個大型數據集,涵蓋60多年來350萬科學家的出版物,我們能夠揭示科學家的地理「職業道路」。每個路徑在個人層面上包含有關城市的信息(在真實地理空間中解析)和在那裡度過的時間(以年為單位)。統計分析給出了科學家為新的歸屬感移動的地理距離及其移動年齡的經驗見解。從個人的職業道路,我們進一步重建了科學家運動的世界網路,其中節點代表城市以及城市之間科學家的內外流動。我們分析了該網路的拓撲性質,包括度分佈,局部聚類係數,路徑長度和協調性。第二個重要貢獻是基於主體的模型,它允許在科學家和網路層面上重現經驗發現。該模型認為代理人具有適應性並考慮潛在的新位置,如果他們允許增加這種適應性。另一方面,地點會對代理人的健康狀況進行排名,只有當他們仍有能力時才會考慮他們。這導致匹配問題,其在演算法上解決。使用經驗數據來校準我們的模型並確定其初始條件,我們能夠根據測量的分佈驗證模型。這允許將模型假設解釋為解釋觀察到的科學家的移動模式的微型決策規則。

用於實際系統的基於拓撲和優化的通用網路恢復

原文標題: Generalized network recovery based on topology and optimization for real-world systems

地址: arxiv.org/abs/1811.0724

作者: Udit Bhatia, Lina Sela Perelman, Auroop Ratan Ganguly

摘要: 為受損網路系統設計有效的恢復策略對於建築,人類和自然系統的恢復能力至關重要。然而,由於無法將不同的哲學結合在一起,例如通過中心性測量的複雜網路拓撲和通過熵測量的網路流優化,進展受到限制。基於網路中心性的指標相對更直觀且計算效率更高,而基於優化的方法更適合動態調整。在這裡,我們通過現實世界交通系統中的案例研究表明,兩種截然不同的網路理念可以融合在一起,形成比任何一種都更有效的混合恢復策略,相對性能取決於聚合網路屬性。直接應用包括災害管理和氣候適應科學,生命線網路的恢復可以挽救生命和經濟。

社會網路上意見形成的Ising-PageRank模型

原文標題: Ising-PageRank model of opinion formation on social networks

地址: arxiv.org/abs/1811.0734

作者: Klaus M. Frahm, Dima L. Shepelyansky

摘要: 我們通過引入相應Google矩陣的Ising或類似旋轉的結構,在社會網路上提出了一種新的Ising-PageRank意見形成模型。網路的每個選民或節點具有對應於社會中的紅色或藍色意見的兩個組成部分。此外,每個選民在網路上傳播紅色或藍色意見,以便選舉人之間的聯繫由兩個兩個矩陣描述,這兩個矩陣有利於兩個意見中的一個或另一個。選民投票選擇紅色或藍色,具體取決於其紅色或藍色PageRank矢量組件的優勢。我們確定最終社會投票對具有紅色(或藍色)影響的節點分數的依賴性,從而允許確定紅色或藍色選項之間的選舉結果邊界的轉變。我們表明,即使精英分數非常小,這個過渡邊界也會受到由網路的頂級PageRank,CheiRank或2DRank節點組成的社會精英選民的意見的顯著影響。分析和數值研究是針對英語維基百科2017和牛津大學2006的網路進行的。

用精英集團探索小世界網路:將嵌入理論引入風險投資網路的動態演化

原文標題: Exploring Small-World Network with an Elite-Clique: Bringing Embeddedness Theory into the Dynamic Evolution of a Venture Capital Network

地址: arxiv.org/abs/1811.0747

作者: Weiwei Gu, Jar-der Luo, Jifan Liu

摘要: 本文使用網路動力學模型來解釋具有精英集團的小世界網路的形成。這個網路是一個小世界網路,其中心有一個精英集團,精英也是許多小團體的中心。這些領導者也是不同小組之間的橋樑。網路動態是一個重要的研究課題,因為它們能夠解釋網路結構的演變。在本文中,中國風險投資(VC)網路是由風險投資公司之間的聯合投資編碼,然後進行分析,以揭示其網路屬性和影響其發展的因素。我們首先建立了一個隨機圖模型來控制網路規模,網路增長,投資頻率和聯合趨勢等因素。然後我們添加了一個夥伴選擇機制,並用兩種理論來分析網路結構的形成:關係嵌入和結構嵌入。之後,我們進行了模擬,並將三種模型與實際的中國VC網路進行了比較。為此,我們計算了elite-clique的EI指數,度分佈,聚類係數分佈和圖案。結果表明,增加嵌入性理論可以顯著提高網路動態模型的預測能力,幫助我們揭示影響小世界產業網路形成的機制,其中以精英集團為中心。

眾包平臺的貢獻者資料模型化

原文標題: Contributors profile modelization in crowdsourcing platforms

地址: arxiv.org/abs/1811.0753

作者: Constance Thierry (DRUID), Jean-Christophe Dubois (DRUID), Yolande Le Gall (DRUID), Arnaud Martin (DRUID)

摘要: 眾包包括將任務外部化給一羣為執行這些任務而獲得報酬的人。人羣通常是多樣化的,可以包括沒有資格和/或任務動機的用戶。在本文中,我們將基於信念函數理論在眾包平臺中引入一種新的用戶專業知識模型化方法,以識別認真和合格的用戶。

屬性網路的離羣感知網路嵌入

原文標題: Outlier Aware Network Embedding for Attributed Networks

地址: arxiv.org/abs/1811.0760

作者: Sambaran Bandyopadhyay, Lokesh N, M. N. Murty

摘要: 歸因網路嵌入受到研究界的極大興趣,因為大多數網路在每個節點中都有一些內容,這也稱為節點屬性。當網路在結構和屬性上保持一致並且節點按預期運行時,現有的歸因網路方法可以很好地工作。但是現實世界的網路通常有異常的節點。通常,這些異常值相對無法解釋,會影響網路中其他節點的嵌入。因此,在存在這種異常值的情況下,所有下游網路挖掘任務都會失敗。因此,需要一種檢測異常並降低其對網路嵌入的整體影響的集成方法。為此,我們為歸因網路提出了一種無監督的異常值感知網路嵌入演算法(ONE),它最大限度地減少了異常值節點的影響,從而生成了強大的網路嵌入。我們調整並共同優化來自網路結構和屬性的損失函數。據我們所知,這是第一種通用網路嵌入方法,它在沒有任何監督的情況下結合了歸因網路的異常值的影響。我們在公開可用的真實網路上進行了實驗,並手動設置了不同類型的異常值,以檢查所提演算法的性能。結果表明,與最先進的方法相比,我們的方法檢測網路異常值具有優越性。我們還考慮網路上的不同下游機器學習應用程序,以顯示ONE作為通用網路嵌入技術的效率。源代碼可在github.com/sambaranban/上獲得。

Twitter上基於影響的聚類模型

原文標題: An Influence-based Clustering Model on Twitter

地址: arxiv.org/abs/1811.0765

作者: Abbas Ehsanfar, Mo Mansouri

摘要: 本文介紹了一種在社會網路上檢測和聚類緊急和病毒主題的時間框架。使用基於用戶在社會網路上的行為和來自Twitter API的數據集的聚類方法來探索對發展病毒內容的內源性和外源性影響。通過引入諸如流行度,突發性和相關性得分等指標來討論結果。結果表明,兩類用戶對開發內容的特徵有明顯的區別。

城市系統的空間測度:從熵到分形維數

原文標題: Spatial Measures of Urban Systems: from Entropy to Fractal Dimension

地址: arxiv.org/abs/1811.0765

作者: Yanguang Chen, Linshan Huang

摘要: 一種分形維數定義基於廣義熵函數。熵和分形維數都可用於表徵複雜的空間系統,如城市和地區。儘管熵與分形維數之間存在固有的聯繫,但它們在城市研究中具有不同的應用範圍和方向。本文重點探討如何利用尺度思想將熵測量轉換為分形維數,用於無標度城市現象的空間分析。城市系統被證明是隨機預分裂和多重分形系統。分形城市的熵具有兩個典型特徵。一個是規模依賴。城市系統的熵值總是取決於空間測量的尺度。另一種是熵保護。不同的分形部分具有相同的熵值。因此,熵在理論上不能反映分形城市的空間異質性。如果我們將廣義熵轉換為多重分形譜,則可以在一定程度上解決尺度依賴性和熵同質性問題,從而進行城市空間分析。規模依賴的本質是城市規模,城市的空間異質性可以通過多重分形來表徵。這項研究可能有助於學生描述和理解城市的空間複雜性。

非法過馬路中的不確定行為

原文標題: Uncertainty behaviour during illegal road crossing

地址: arxiv.org/abs/1811.0770

作者: Marie Pele, Killian Brunet, Anais Dasnon, Mathilde Jay, Anne Regnier, Cedric Sueur

摘要: 涉及行人的道路交通事故在城市中仍然過多,特別是在人行橫道上。許多行人在斑馬車的紅燈處穿過,增加了發生事故的風險,因為他們以及人們對其進行了模仿。一些研究試圖瞭解這些非法道路交叉行為的原因,顯示出年齡,性別和文化的影響。本研究旨在瞭解兩個不同國家的不確定行為的原因:法國和日本。道路交叉期間的不確定行為在此被定義為在紅燈處的交叉行為期間的行走停止或減速。當行人獲得的不同信息之間存在衝突時,尤其是私人信息和社交信息之間存在衝突,就會發生不確定性。這種不確定性行為可以通過加速完成過馬路或放棄來實現。我們的研究表明,與法國相比,日本的不確定時間更長。當有人陪伴他們時,日本行人在較長時間內猶豫不決。打電話對不確定時間沒有影響。除了加速之外,還有更多的放棄,而且這個速度隨著車道的數量而增加。此外,隨著已經過馬路的行人數量的增加,人們趨向於加速。這項研究證實,行人在道路交叉口追蹤社會信息,並在發現錯誤時猶豫不決,增加了發生事故的風險。瞭解這一點,可能會提出不同的解決方案,以避免這些無意的非法越境行為。

綜合社會聯繫網路複雜性與現實性的實證評估

原文標題: An Empirical Assessment of the Complexity and Realism of Synthetic Social Contact Networks

地址: arxiv.org/abs/1811.0774

作者: Kiran Karra, Samarth Swarup, Justus Graham

摘要: 我們使用多個圖複雜度量來評估合成生成的人類活動網路的真實性,與幾個程式化的網路模型以及文獻中的經驗網路集合進行比較。合成網路是通過整合來自多個來源的人口數據生成的,包括人口普查,交通調查和地理數據。由此產生的網路代表了每日或每週人類交互的近似值。我們的結果表明,根據我們的方法,合成生成的圖更接近於在多個結構測量中測量的真實世界圖,而不是使用文獻中的常見網路模型生成的一系列程式化圖。

超圖的Forman-Ricci曲率

原文標題: Forman-Ricci Curvature for Hypergraphs

地址: arxiv.org/abs/1811.0782

作者: Wilmer Leal, Guillermo Restrepo, Peter F. Stadler, Jürgen Jost

摘要: 與基於圖的複雜網路模型相比,超圖是超出圖的二元關係的更一般的結構。對於圖表,已經設計了衡量其結構不同方面的統計數據,並且正在進行研究以設計超圖。 Forman-Ricci曲率是圖的統計量,它基於黎曼幾何,並且通過分析邊而不是頂點來強調網路中頂點的關係特徵。儘管這種曲率有不同的應用,但尚未針對超圖制定。在這裡,我們為有向和無向超圖設計Forman-Ricci曲率,其中曲線的曲率是特定情況。我們報告它的上限和下限以及圖情況的相應邊界。曲率量化了超邊(弧)大小與其他超邊(弧)中的超邊(弧)頂點的參與程度之間的權衡。我們計算了兩個大型網路的曲率:維基百科投票網路和 emph {Escherichia coli}代謝網路。在第一種情況下,曲率由超邊界大小來控制,而在第二種情況下由超邊度來控制。我們發現參與維基百科選舉的用戶數量與有經驗的用戶的參與密切相關。代謝網路的曲率值允許檢測多餘和瓶頸反應。發現ADP磷酸化是代謝瓶頸反應,但反向反應不是新陳代謝的核心。

誇大的新聞內容在社交媒體的傳播特徵

原文標題: Characterizing the spread of exaggerated news content over social media

地址: arxiv.org/abs/1811.0785

作者: Jasabanta Patro, Sabyasachee Baruah, Vivek Gupta, Monojit Choudhury, Pawan Goyal, Animesh Mukherjee

摘要: 在本文中,我們考慮一個數據集,其中包括來自英國不同大學的健康研究新聞稿以及相應的新聞文章。首先,我們進行探索性分析,以瞭解科學期刊上發布的基本信息如何在這些新聞稿或新聞文章中被誇大時被誇大。初步分析顯示,一些新聞機構誇大了他們在健康領域發表的文章的近60%;超過50%的某些大學的新聞稿被誇大了;關於生活方式和童年等主題的文章被誇大了。受上述觀察的啟發,我們設定了本文的中心目標,即調查誇大的新聞如何在Twitter等在線社會網路上傳播。 LIWC分析指出了一個顯著的觀察結果,這些晚期的推文基本上充滿了來自意見的辭彙,並且實現了類別,這表明,如果有足夠的時間,人羣的智慧實際上能夠分辨出誇張的新聞。作為第二步,我們研究那些從不或很少發布誇張新聞內容的用戶的特徵,並將其與那些更頻繁發布誇張新聞內容的用戶進行比較。我們觀察到後一類用戶每推文轉發次數較少或提及次數較少,關注者數量明顯增多,使用更多俚語,減少雙曲詞和減少辭彙收縮。我們還觀察到LIWC類別如生物,健康,身體和負面情緒在後一類用戶發布的推文中更為明顯。作為最後一步,我們將這些觀察結果用作特徵,並自動對兩組進行分類,獲得0.83的F1分數。

論網路可見性問題

原文標題: On the Network Visibility Problem

地址: arxiv.org/abs/1811.0786

作者: Khashayar Gatmiry, Manuel Gomez-Rodriguez

摘要: 社交媒體是一種注意力經濟,用戶在其追隨者的飼料中不斷爭奪注意力。如果用戶的帖子在其關注者的供稿頂部長時間可見,則用戶可能會更加關注其關注者及其受眾羣體的關注度。但是,這取決於其關注者在其Feed中接收信息的速度,而這反過來又取決於其關注者所關注的用戶。然後,誰應該跟隨誰來最大化每個用戶實現的可見性?在本文中,我們使用時間點過程框架表示用戶的帖子和提要。在此表示下,問題減少到在擬陣約束下優化非子模塊非遞減集函數。然後,我們證明set函數滿足一個新的屬性 xi -submodularity,它允許一個簡單而有效的貪心演算法享受理論保證。特別是,我們證明瞭貪婪演算法提供(1 / xi + 1)近似因子,其中 xi 是強子模塊比率,是我們能夠在我們的問題中約束的近似子模塊度的新度量。從Twitter收集的合成數據和實際數據的實驗表明,我們的貪婪演算法能夠始終優於多個基線。

聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。

推薦閱讀:

相關文章