• 隨機遊走者在無標度網路上訪問的節點不同;
  • 受訪者驅動抽樣中的漸近種子偏差;
  • 通過估計塊轉移概率減少受訪者驅動採樣中的種子偏差;
  • 出版物的中介性;
  • 利用社交媒體分析提升旅遊領域決策能力;
  • 社會網路層次識別研究綜述;
  • 多層網路中的核分解:理論、演算法和應用;

隨機遊走者在無標度網路上訪問的節點不同

原文標題: Distinct nodes visited by random walkers on scale-free networks

地址: arxiv.org/abs/1501.0124

作者: Aanjaneya Kumar, M. S. Santhanam

摘要: 離散格子上的隨機遊走是基本模型,它們構成了我們理解運輸和擴散過程的基礎。對於複雜網路上的單個隨機遊走者,已知許多屬性,例如平均首次通過時間和覆蓋時間。然而,諸如搜索引擎和推薦系統的許多最近的應用涉及複雜網路上的多個隨機遊走者。在這項工作中,基於數值模擬,我們表明, W 隨機遊走者在時間 t 中沒有訪問的無標度網路的節點部分具有拉伸的指數形式,與網路的細節和步行者的數量無關。這導致 W 步行者未訪問的節點與時間 t 內的一個步行者之間的冪律關係。有效地,找到由 W 步行者訪問的不同節點的問題可以減少到單個步行者的問題。通過在近似顯示無標度結構的四個不同的真實網路上驗證它們來證明結果的穩健性。

受訪者驅動抽樣中的漸近種子偏差

原文標題: Asymptotic Seed Bias in Respondent-driven Sampling

地址: arxiv.org/abs/1808.1059

作者: Yuling Yan, Bret Hanlon, Sebastien Roch, Karl Rohe

摘要: 受訪者驅動的抽樣(RDS)通過激勵抽樣的個體將其聯繫人引入樣本來收集網路人群中的個體樣本。該迭代過程從一些種子節點初始化。有時,這種選擇會產生大量的種子偏差。其他時候,種子偏差很小。本文通過表徵其對各種RDS估計量的限制分布的影響,對這種偏差有了更深刻的理解。使用經典工具和多類型分支過程的結果(Kesten和Stigum,1966),我們證明了種子偏差對於廣義最小二乘(GLS)估計可以忽略不計,對於逆概率加權和Volz-Heckathorn都是不可忽略的。 (VH)估計。特別地,我們顯示(i)高於臨界閾值,VH收斂到非平凡的混合物分布,其中混合物組分取決於種子節點,並且混合物分布可能是多模態的。此外,(ii)在馬爾可夫過程的一定條件下,GLS收斂於獨立於種子節點的高斯分布。模擬數據和經驗社會網路的數值實驗表明,這些結果似乎超出了定理的馬爾可夫條件。

通過估計塊轉移概率減少受訪者驅動採樣中的種子偏差

原文標題: Reducing Seed Bias in Respondent-Driven Sampling by Estimating Block Transition Probabilities

地址: arxiv.org/abs/1812.0118

作者: Yilin Zhang, Karl Rohe, Sebastien Roch

摘要: 受訪者驅動的抽樣(RDS)是研究邊化或難以接觸的人群的流行方法。它通過激勵參與者將他們的朋友推薦到研究中來收集來自網路人群的樣本。分析RDS樣品的一個主要挑戰是種子偏差。種子偏見指的是當社會網路被劃分為多個社區(或區塊)時,RDS樣本可能無法提供人口中不同社區的均衡表示,並且這種不平衡與初始參與者(或種子)。在這種情況下,估計量的分布通常是非平凡的混合,其由(1)種子確定,(2)推薦如何從一個塊轉換到另一個塊。本文表明(1)塊轉移概率易於高精度估計,(2)我們可以使用這些估計的塊轉移概率來估計塊上的平穩分布,從而估計塊比例。這種塊上的靜態分布先前已用於RDS文獻中,以評估採樣過程是否已「混合」。我們在簡單的後分層(PS)估計中使用這些估計的塊比例,這大大減少了種子偏差。通過以這種方式聚合塊/層,我們證明PS估計量是 sqrt {n} - 在馬爾可夫模型下是一致的,即使其他估計量不是。模擬表明,與最先進的估計器相比,PS估計器具有更小的均方根誤差(RMSE)。

出版物的中介性

原文標題: Intermediacy of publications

地址: arxiv.org/abs/1812.0825

作者: Lovro ?ubelj, Ludo Waltman, Vincent Traag, Nees Jan van Eck

摘要: 科學出版物的引文網路提供了對科學知識結構和發展的基本見解。我們提出了一種新的措施,稱為中介,用於追蹤科學知識的歷史發展。鑒於兩種出版物,一種較舊的和較新的出版物,中介性確定了從較舊的出版物到最近的出版物在歷史發展中起主要作用的出版物。已確定的出版物對於連接引文網路中較舊和較新的出版物非常重要。在提供了介數中心性的正式定義之後,我們研究了它的數學性質。然後,我們提出了兩個實證案例研究,一個是在社區檢測和科學計量學文獻之間的界面上追蹤歷史發展,另一個是檢查同行評審文獻的發展。我們從數學和經驗上展示了介數中心性與主要路徑分析的不同之處,主要路徑分析是追蹤引文網路歷史發展的最常用方法。主要路徑分析往往傾向於較長路徑而不是較短路徑,而中間路徑具有相反趨勢。與主要路徑分析相比,我們得出結論,中介為追蹤科學知識的歷史發展提供了更有原則的方法。

利用社交媒體分析提升旅遊領域決策能力

原文標題: Enhancing Decision Making Capacity in Tourism Domain Using Social Media Analytics

地址: arxiv.org/abs/1812.0833

作者: Supun Abeysinghe, Isura Manchanayake, Chamod Samarajeewa, Prabod Rathnayaka, Malaka J. Walpola, Rashmika Nawaratne, Tharindu Bandaragoda, Damminda Alahakoon

摘要: 社交媒體在過去十年中獲得了極大的歡迎。人們傾向於自由地表達他們在社交媒體上的日常遭遇。這些日常遭遇包括他們旅行的地方,他們嘗試的酒店或餐館以及與旅遊相關的方面。由於人們通常在社交媒體上表達他們的真實經歷,所表達的意見包含有價值的信息,可用於產生商業價值和協助決策過程。由於數據量很大,手動瀏覽每個項目並提取信息並不是一個可行的任務。因此,我們提出了一種社交媒體分析平台,該平台能夠使用機器學習技術和可視化工具識別討論途徑和方面及其相應的情感和更深層的情感,該工具以可理解和簡潔的方式顯示所提取的見解。確定的主題路徑和方面將使決策者能夠深入了解關於實體的討論最多的主題,而相關的情緒和情感將有助於識別反饋。

社會網路層次識別研究綜述

原文標題: A Survey of Hierarchy Identification in Social Networks

地址: arxiv.org/abs/1812.0842

作者: Denys Katerenchuk

摘要: 人類本質上是社會性的。縱觀歷史,人們已經形成了社區並建立了關係。與同事,朋友和家人的大多數關係都是在面對面的互動中發展起來的。這些關係是通過明確的通信手段建立的,例如單詞和隱含的語調,如語調,肢體語言等。通過分析人類交互,我們可以得出關於對話參與者之間的關係和影響的信息。然而,隨著互聯網的發展,人們開始通過在線社會網路中的文本進行交流。有趣的是,他們將他們的交際習慣帶到了互聯網上。許多社會網路用戶彼此建立關係,並與領導者和追隨者建立社區。認識到這些等級關係是一項重要任務,因為它將有助於了解社會網路並預測未來趨勢,改進建議,更好地定位廣告,並通過識別匿名恐怖組織的領導者來改善國家安全。在這項工作中,我概述了該領域的當前研究,並介紹了處理社會網路中識別等級關係問題的最先進方法。

多層網路中的核分解:理論、演算法和應用

原文標題: Core Decomposition in Multilayer Networks: Theory, Algorithms, and Applications

地址: arxiv.org/abs/1812.0871

作者: Edoardo Galimberti, Francesco Bonchi, Francesco Gullo, Tommaso Lanciano

摘要: 多層網路是模擬複雜系統的強大範例,其中可能在同一組實體之間發生各種關係。儘管對這種類型的網路中的各種問題,演算法和分析方法非常感興趣,但是提取密集子圖的問題仍然很大程度上未被探索。作為這個方向的第一步,我們研究了多層網路的核心分解問題。與核心全部彼此嵌套的單層對應物不同,在多層上下文中,多層核心之間不存在總排序:它們形成晶格,其大小在層數中是指數的。在這個設置中,我們設計了三種演算法,這些演算法在訪問核心點陣和修剪技術方面有所不同。我們在各種各樣的真實多層網路上評估三種演算法的時間和空間效率。然後,我們研究了僅提取最內核的問題,即,在所有層上的索引方面,不受任何其他核心支配的核心。由於內部核心的數量級比所有核心都要小,因此需要開發能夠有效利用最大性屬性並直接提取最內核的演算法,而無需先計算完整的分解。此外,我們展示了多層核心分解工具在多層網路中提取密集子圖的問題。我們介紹了多層最密集子圖的定義,它在高密度和高密度層數之間進行折衷,並說明如何利用多層芯分解來質量保證來近似這個問題。我們還利用多層核心分解來加速頻繁交叉圖准集團的提取,並將社區搜索問題推廣到多層設置。

聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號「網路科學研究速遞」(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。

推薦閱讀:

相关文章