❶ 10X單細胞空間聯合分析方法匯總及演算法總結
Cell2location 採用分層貝葉斯框架,假設基因表達計數遵循負二項分布。 它首先使用外部 scRNAseq 數據作為參考來估計細胞類型特異性特徵。 觀察到的空間表達計數矩陣用負二項分布建模,其中基因可用的特定技術敏感性、基因和位置特定的加性偏移作為平均參數的一部分包括在內 。 然後 cell2location 使用變分貝葉斯推理來近似後驗分布並相應地產生參數估計 。
使用變分推理 (DestVI) 對空間轉錄組學剖面進行反卷積是一種用於 ST 數據多解析度分析的概率方法 。 DestVI 通過連續的潛在變數明確地模擬細胞類型內的變化,而不是將分析限制在細胞類型的離散視圖中。這種連續的細胞內類型變化以及相應的細胞類型特定配置文件是通過條件深度生成模型學習的,特別是使用解碼器神經網路的變分推理。在該方案中, 分別為 scRNA-seq (scLVM) 和 ST 數據 (stLVM) 構建了兩個不同的潛在變數模型 (LVM) 。 DestVI 同樣假設觀察到的轉錄本的數量遵循負二項分布。 stLVM 使用由 scLVM 訓練的解碼器神經網路,並使用最大後驗 (MAP) 推理方案獲得細胞類型比例,其中假設每個點中觀察到的轉錄本的數量遵循推斷的單細胞的加權和負二項分布。
RCTD 最初是為 Slide-seq 數據設計的,但它也可以用於其他 ST 數據。 它假設觀察到的每個spot的spot-level基因計數遵循泊松分布,同時通過包含基因特異性隨機效應項來解釋平台效應 。 RCTD 首先使用外部 scRNA-seq 參考數據來估計每種細胞類型的平均基因表達譜。 然後通過選擇跨細胞類型的差異表達 (DE) 基因來執行基因過濾,並估計基因特異性平台效應的方差。 將推斷的平台效應插入概率模型以獲得細胞類型比例的最大似然估計 (MLE)。
STdeconvolve 是一種針對 ST 數據的無參考和無監督細胞類型反卷積方法 。 STdeconvolve 與其他方法的主要區別在於 STdeconvolve 可以在不使用外部 scRNA-seq 參考的情況下執行細胞類型反卷積。 該方法建立在潛在狄利克雷分配 (LDA) 的基礎上,以識別每種細胞類型的推定轉錄譜及其在每個 ST 點中的比例,其定義為由多項式分布和細胞類型分布建模的預定數量的細胞類型的混合物是從uniform Dirichlet distribution中得出的。 STdeconvolve 假設每種細胞類型都存在高度共表達的基因,並選擇顯著過度分散的基因來告知潛在細胞類型。
Stereoscope 實現了反卷積目的,同時使用帶注釋的 scRNA-seq 參考和 ST 數據對細胞類型進行空間映射。 Stereoscope 還依賴於常用的假設, 即空間和單細胞數據的計數均遵循負二項分布 。 Stereoscope 包含一個雜訊術語作為「虛擬」細胞類型的一種形式,以解釋不對稱數據集,其中細胞類型在空間和單細胞數據中沒有完美重疊。 MLE 用於使用 scRNA-seq 參考數據估計細胞類型特定參數,MAP 用於推斷 ST 數據中的細胞類型混合。
SPOTlight 是一種反卷積演算法, 它採用非負矩陣分解 (NMF) 回歸演算法以及非負最小二乘法 (NNLS) 。 在 SPOTlight 中,執行 NMF 以識別 scRNA-seq 參考中特定於細胞類型的top profile,並執行 NNLS 來識別spot top profile,這是反卷積的結果。 此外,據報道, SPOTlight 在不同的生物場景和具有匹配和外部參考的不同技術版本中執行靈敏且准確 。
DSTG 是一種 基於相似性的半監督圖卷積網路 (GCN) 模型,可以恢復每個點的細胞類型比例 。 通過利用 scRNA-seq 數據,DSTG 首先通過隨機匯集從 scRNA-seq 數據中選擇的 2 到 8 個細胞作為 ST 點,構建稱為「偽 ST」的合成 ST 數據。 然後,為了捕捉點之間的相似性並合並偽 ST 和真實 ST 數據, DSTG 通過在典型相關分析 (CCA) 識別的共享空間中找到相互最近的鄰居來學習鏈接圖 。 半監督 GCN 使用偽和真實 ST 數據和鏈接圖進行訓練,可用於預測真實 ST 數據中的細胞類型比例。
總之,許多功能強大的 ST 反卷積工具已經專門針對 ST 數據集開發和定製。 這些方法在模擬和真實數據集中都證明了它們的實用性。 通過了解 ST 數據中的細胞比例變化以及空間信息進行下游分析,我們可以更好地揭示潛在的生物學機制,並進一步發現使用 scRNA-seq 數據集無法實現的新發現。 然而,目前還沒有對這些細胞去卷積方法進行公平和全面的比較。 我們將使用多個真實的 ST 數據集,包括單細胞水平解析度和帶有病理學家注釋的點級解析度 ST 數據,以系統和客觀地評估這些方法的性能 。
總而言之, 沒有一種方法能夠在不同的組織類型中始終優於其他方法 。在研究中測試的大多數概率方法,尤其是 Adroit、RCTD、Cell2Location 和 Stereoscope,在整個組織中都表現出始終如一的高性能。 STdeconvolve 作為唯一的無參考方法,具有識別組織結構和細胞混合物的能力,但必須仔細處理細胞類型映射。徹底評估了各種情況,包括不同的組織、不同的技術和數據解析度、不同數量的單細胞和斑點,以及用於分析的基因的數量和類型。因此, 建議調查人員首先確定我們評估的一些與他們自己的數據最匹配的情景,並在這些情景下選擇表現最佳的方法 。
With the use of the appropriately chosen methods and gene sets, we hope the increased accuracy of cell mapping inference will assist in the future downstream analyses
雜訊和高維 ST 數據的去噪和降維可以允許更有效的信息提取。我們預計細胞類型反卷積將進一步受益於有效去噪和減少 ST 數據維度的方法的開發和進步 。
生活很好,有你更好
❷ 空間疊加分析的基礎是什麼
空間疊合分析是指在相同的空間坐標系統下,將同一地區兩個不同地理特徵的空間屬性數據疊加,以產生空間區域的多重性特徵,或建立地理對象之間的空間對應關系。
在統一空間參照系統條件下,每次將同一地區兩個地理對象的圖層進行疊合,以產生空間區域的多重屬性特徵,或建立地理對象之間的空間對應關系。有點與多邊形、線與多邊形、多邊形與多邊形的疊合。
使用疊加分析可將多個數據集的特徵合並為一個特徵。然後,可查找具有某一特定組屬性值的特定位置或區域,即與您指定的條件相符合。經常使用此方法查找適於特定用途的位置或容易遭受某種風險的位置。
❸ 空間分析方法
空間分析是對於地理空間現象的定量研究,其常規能力是操縱空間數據使之成為不同的形式,並且提取其潛在的信息。空間分析是GIS的核心。空間分析能力(特別是對空間隱含信息的提取和傳輸能力)是地理信息系統區別與一般信息系統的主要方面,也是評價一個地理信息系統成功與否的一個主要指標。GIS的空間分析是指以地理事物的空間位置和形態為基礎,以地學原理為依託,以空間運算為特徵,提取和產生新的空間信息技術和過程,如獲取關於空間分布、空間形成及空間演變的信息。
空間信息量算空間信息量算是空間分析的定量化
空間分析基礎。空間實體間存在著多種空間關系,包括拓撲、順序、距離、方位等關系。通過空間關系查詢和定位空間實體是地理信息系統不同於一般資料庫系統的功能之一。如查詢滿足下列條件的城市:在京九線的東部, 距離京九線不超過200公里,城市人口大於100萬並且居民人均年收入超過1萬。整個查詢計算涉及了空間順序方位關系(京九線東部),空間距離關系(距離京九線不超過200公里),甚至還有屬性信息查詢(城市人口大於100萬並且居民人均年收入超過1萬)。空間信息量算包括:質心量算、幾何量算、形狀量算。
空間信息分類這是GIS功能的重要組成部分。對於線狀地物求長度、曲率、方向,對於面狀地物求面積、周長、形狀、曲率等;求幾何體的質心;空間實體間的距離等。
空間分析常用的空間信息分類的數學方法有:主成分分析法、層次分析法、系統聚類分析、判別分析等; r /> 緩沖區分析緩沖區分析是針對點、線、面等地理實體,自動在其周圍建立一定寬度范圍的緩沖區多邊形。鄰近度描述了地理空間中兩個地物距離相近的程度,其確定是空間分析的一個重要手段。交通沿線或河流沿線的地物有其獨特的重要性,公共設施的服務半徑,大型水庫建設引起的搬遷,鐵路、公路以及航運河道對其所穿過區域經濟發展的重要性等,均是一個鄰近度問題。緩沖區分析是解決鄰近度問題的空間分析工具之一。 所謂緩沖區就是地理空間目標的一種影響范圍或服務范圍。
疊加分析大部分GIS軟體是以分層的方式組織地理景觀,將地理景觀按主題分層提取,同一地區的整個數據層集表達了該地區地理景觀的內容。地理信息系統的疊加分析是將有關主題層組成的數據層面,進行疊加產生一個新數據層面的操作,其結果綜合了原來兩層或多層要素所具有的屬性。疊加分析不僅包含空間關系的比較,還包含屬性關系的比較。疊加分析可以分為以下幾類:視覺信息疊加、點與多邊形疊加、線與多邊形疊加、多邊形疊加、柵格圖層疊加。
網路分析對地理網路(如交通網路)、城市基礎設施網路(如各種網
空間分析線、電力線、電話線、供排水管線等)進行地理分析和模型化,是地理信息系統中網路分析功能的主要目的。網路分析是運籌學模型中的一個基本模型,它的根本目的是研究、籌劃一項網路工程如何安排,並使其運行效果最好,如一定資源的最佳分配,從一地到另一地的運輸費用最低等。網路分析包括:路徑分析(尋求最佳路徑)、地址匹配(實質是對地理位置的查詢)以及資源分配。
空間統計分析GIS得以廣泛應用的重要技術支撐之一就是空間統計與分析。例如, 在區
空間分析域環境質量現狀評價工作中,可將地理信息與大氣、土壤、水、雜訊等環境要素的監測數據結合在一起,利用GIS軟體的空間分析模塊,對整個區域的環境質量現狀進行客觀、全面的評價,以反映出區域中受污染的程度以及空間分布情況。通過疊加分析,可以提取該區域內大氣污染分布圖、雜訊分布圖;通過緩沖區分析,可顯示污染源影響范圍等。可以預見,在構建和諧社會的過程中,GIS和空間分析技術必將發揮越來越廣泛和深刻的作用。常用的空間統計分析方法有:常規統計分析、空間自相關分析、回歸分析、趨勢分析及專家打分模型等。空間自相關(spatial autocorrelation)可用Moran's I,半變異函數,LISA,Gi,SatScan檢測;空間分異性(spatial stratified heterogeneity)可用地理探測器q-statistic檢驗。