<em id="0s9ur"></em>

<em id="0s9ur"></em>
<div id="0s9ur"><ol id="0s9ur"></ol></div>
<div id="0s9ur"><tr id="0s9ur"><object id="0s9ur"></object></tr></div>

      <dl id="0s9ur"><ins id="0s9ur"><small id="0s9ur"></small></ins></dl>

      三種數據提供有歧義的結果的情況,因果關系如何幫助澄清數據的解讀

      論智 ? 2018-10-31 09:07 ? 次閱讀

      編者按:Databricks數據科學主管Sean Owen討論了三種數據提供有歧義的結果的情況,以及因果關系如何幫助澄清數據的解讀。

      相關和因果

      相關性不等于因果。僅僅因為冰淇淋和美黑霜銷量同時上升或下降并不意味著兩者之間有什么因果關系。然而,人類的思考方式傾向于因果關系。你大概已經意識到這兩種商品的銷量均取決于夏季炎熱的天氣。那么,因果關系是一個什么樣的角色?

      新入行的數據科學家可能有一個印象,因果關系是一個大家避而不談的話題。這是一個錯誤印象。我們使用數據決定“哪則廣告將導致更多點擊?”這樣的事情。已經有一個易用、開放工具的生態系統,可供我們基于數據建立模型,我們覺得這些模型可以回答關于成因和效果的問題。什么時候它們確實做到了這一點,什么時候我們誤以為它們做到了?

      數據告訴我們什么,和我們認為數據告訴我們什么,這兩者之間存在著微妙的空隙,這正是困惑和錯誤的源泉。新入行的數據科學家,盡管配備了強大的建模工具,仍可能成為“未知的未知”的犧牲品,即使是在簡單的分析中也是如此。

      本文將演示三種看起來簡單的情況,這些情況會產生驚人的歧義結果。劇透:在所有情形下,因果關系是澄清數據解讀必不可少的成分。包括概率圖模型和do-calculus在內的激動人心的工具,能夠讓我們基于數據和因果關系進行推理,得出強有力的結論。

      兩條“最佳擬合”直線

      考慮R內置的cars數據集。這個簡單的小數據集提供了不同車速的制動距離。假設低速情況下,兩者的關系是線性的。

      再沒什么能比線性回歸更簡單了吧?距離是速度的函數:

      同樣,速度也是距離的函數:

      盡管看起來是同一件事,兩種說法,這兩種回歸會給出不同的最佳擬合直線。這兩條線不可能都是最佳的,那么哪一條才是最佳擬合直線,為什么?

      如果你想親自驗證,可以查看、運行創建上面兩個圖形的代碼:https://trial.dominodatalab.com/u/srowen/causation/view/main.R

      兩個最佳療法

      下面的數據集可能看起來很熟悉。它顯示了腎結石的兩種療法的治愈率。

      你也許注意到了上表的奇怪之處。總體而言,B療法的治愈率更高。然而,A療法在小結石上有著更高的治愈率,在小結石以外的情形(大結石)上也有著更高的治愈率。這怎么可能?你可以自己算一下。

      許多人會馬上意識到這是辛普森悖論的一個典型例子。(這個例子取自辛普森悖論的維基頁面。)意識到這一點很重要。然而,意識到這一點并不能回答真正的問題:哪種療法更好?

      這里,A療法更好。較大的腎結石更難治療,總體而言治愈率更低。在這些比較困難的情形下,更常應用A療法。雖然A療法實際上更好,但因為更常應用在困難情形下,總體治愈率被拉低了。結石大小是一個混淆變量,表格的橫行控制了結石大小。所以,控制所有像這樣的變量以避免出現悖論總不會錯吧?

      考慮下面的數據:

      這次是根據治療后病人的血酸分組。基于這些數據,哪種療法更好?為什么?

      虛幻的相關性

      最后,考慮R內置的mtcars數據集。它提供了20世界70年代的一些車型的統計數據,例如引擎汽缸容量、燃油效率、氣缸數量,等等。考慮drat(后輪軸減速比)和carb(化油器數量——現在的車不使用化油器,改用電子噴射系統)的相關性。

      幾乎沒有相關性(r = -0.09)。這是有道理的,畢竟變速設計和引擎設計實際上是正交的。(我承認這不是一個最直觀的例子,但這是R語言內置的簡易數據集中最易懂的例子。)

      然而,如果我們只考慮6缸或8缸引擎的車型:

      有很清楚的正相關性(r = 0.52)。那么其他車型呢?

      竟也有較小的正相關性(r = 0.22)。兩個變量在部分數據上相關,在剩余數據上也相關,但是在整體數據上卻不相關,怎么可能會這樣?

      答案在因果關系之中

      當然,這些問題都有答案。在第一個例子中,兩條不同的直線源自兩組不同的假定。距離 ~ 速度回歸意味著距離是速度的線性函數,加上高斯噪聲,直線最小化實際距離和預測距離的均方誤差。另一條直線最小化實際速度和預測速度的均方誤差。前者對應的假定是速度的不同導致了制動距離的不同,很有道理;后者暗示距離的不同導致了速度的不同,沒有意義。所以源自距離 ~ 速度的直線是正確的最佳擬合直線。不過,判定這一點需要數據以外的信息。

      速度不同導致制動距離不同這一想法可以用一個(非常簡單的)有向圖表示:

      類似地,在辛普森悖論的第二個例子中,血酸不再是混淆變量,而是中介變量。它并不導致選取哪種療法,反而是選取哪種療法導致了不同的血酸水平。將它作為控制變量等于移除了療法的主要效果。在這一情形下,B療法看起來要好一點,因為它導向更低的血酸,從而導向更好的結果(盡管A療法確實看起來有一些正面的次級效應)。

      因此,辛普森悖論的原場景為:

      而第二個場景為:

      同樣,這里的“悖論”是可以解決的。關于因果關系的外部信息解決了“悖論”——兩個場景的解決方式不同!

      第三個例子是伯克森悖論的一個例子。假定后輪軸減速比和化油器數目都影響汽缸數目(這里不展開討論,假定引擎設計上這一點成立),那么后輪軸減速比和化油器數量沒有相關性這一結論是正確的。控制汽缸數目創造了不存在的相關性,因為汽缸數目是同時和后輪軸減速比與化油器數量相關的“碰撞”變量。

      同樣,數據沒有告訴我們這點;具備變量之間因果關系的知識才能得出這一結論。

      概率圖模型和do-Calculus

      我們上面繪制概率圖模型(PGM)有其目的。這些圖表達了成因-結果關系中的條件概率依賴的類型。盡管上述情形的概率圖很是微不足道,它們很容易變得很復雜。然而,不管簡單還是復雜,我們都可以通過分析概率圖檢測正確分析數據所需的變量之間的關系。

      PGM是一個有趣的主題。(Coursera上有Daphne Koller開的課程。)理解因果關系的重要性,以及如何分析因果關系以正確解讀數據是數據科學家之旅必經的一步。

      這類分析導向了一種可能更加激動人心的能力。假如一個變量取了不同的值,會發生什么?做出這方面的推理是有可能的。這一想法聽起來像是條件概率:給定今天的冰淇淋銷量很高(IC)這一條件,美黑霜的銷量很高(ST)的概率是多少?也就是,P(ST|IC)是多少?基于數據集,這很容易回答。如果兩者是正相關的,我們可以進一步期望P(IC|ST) > P(IC)——也就是說,當美黑霜的銷量很高的時候,冰淇淋的銷量很高的概率更大。

      然而,如果我們提高了美黑霜的銷量(也許可以記作do(ST)),那么冰淇淋的銷量會增長嗎?很清楚,P(IC|do(ST))和P(IC|ST)不是一回事,因為我們不期望這兩者之間有什么因果聯系。

      數據只提供了簡單的條件概率嗎?我們有可能演算數據中未曾發生的反事實概率,從而評判這些有關行動的論斷嗎?

      令人驚喜的答案,是的,在因果模型和Judea Pearl提出的“do-calculus”的幫助下,這是有可能的。do-calculus是Pearl的新書The Book of Why的主題。這本書總結了因果思考的歷史,貝葉斯網絡,圖模型和Pearl自己對這一領域的顯著貢獻,在此高度推薦。

      也許do-calculus最引人入勝的演示是這本書對吸煙致癌相關研究的回溯分析。據Pearl所述,吸煙致癌到底是通過肺部煙焦油囤積,還是因為未知的基因因素同時導致了喜歡吸煙和易得肺癌,對此人們曾有疑問。不幸的是,這一基因因素無法觀測,也不可能控制。畫出其中暗含的因果模型,就很容易做出推理。

      即使在不能確定基因因素是否存在的情況下,還有可能回答“吸煙致癌”這樣的問題嗎?P(癌|do(吸煙)) > P(癌)嗎?

      通過應用do-calculus的三條基本規則,這是有可能做到的,具體細節這里就不展開了(請看論文和書)。應用do-calculus規則之后,只涉及吸煙、煙焦油、癌癥的條件概率,這些都可以從現實數據集中得出:

      僅僅通過數據中的條件概率,即使在不知道是否存在未知混淆變量的情況下,就有可能知道是否吸煙導致患癌風險增加,

      結語

      有經驗的數據科學家不僅知道如何將工具作為黑箱使用,還知道模型和數據的正確解讀常常具有歧義,甚至違背直覺。避免常見誤區是資深從業者的標志。

      幸運的是,許多這樣的悖論有著常見的來源,通過基于成因-效果網絡的推理,可以分析這些來源,從而解決這些悖論。概率圖模型和統計方法一樣重要。

      再加上do-calculus,我們可以基于數據做出一些解讀和分析,對那些習慣相信無法僅僅從數據中得到因果或反事實結論的人來說,這些解讀和分析十分驚人!

      原文標題:相關性≠因果:概率圖模型和do-calculus

      文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

      收藏 人收藏
      分享:

      評論

      相關推薦

      用Python爬了爬自己的微信朋友

      看來我大部分的朋友都是在廣東的(不是廢話嗎),其中廣東的朋友大部分集中在廣、深、珠,第二名是在奧克蘭....

      的頭像 機器人大講堂 發表于 01-02 16:59 ? 74次 閱讀
      用Python爬了爬自己的微信朋友

      如何使用多層非負局部Laplacian稀疏編碼進行圖像分類

      針對單層稀疏編碼結構對圖像特征學習能力的局限性問題,提出了一個基于圖像塊稀疏表示的深層架構,即多層融....

      發表于 01-02 15:17 ? 9次 閱讀
      如何使用多層非負局部Laplacian稀疏編碼進行圖像分類

      組合型冪指函數三穩態隨機共振微弱信號檢測

      在強噪聲背景下,針對微弱信號的檢測和提取困難的問題,在經典的雙穩態系統模型基礎上,結合Caussia....

      發表于 01-02 14:40 ? 8次 閱讀
      組合型冪指函數三穩態隨機共振微弱信號檢測

      廣汽新能源數據監控數據解析

      基本數據情況,保有量2.5萬臺,租賃車輛1.81萬臺,私人車輛6852臺,占比約27.38%,所有的....

      的頭像 汽車電子設計 發表于 12-31 11:25 ? 302次 閱讀
      廣汽新能源數據監控數據解析

      你所不知道的linux匿名管道知識詳解

      通過上面的解釋可以看到, 假設 COMMAND1 | COMMAND2, 那么COMMAND1的標準....

      的頭像 馬哥Linux運維 發表于 12-31 09:04 ? 154次 閱讀
      你所不知道的linux匿名管道知識詳解

      谷歌新研究使用連續拍攝的一對非模糊圖像,能夠合成運動模糊圖像

      他們設計的神經網絡架構包括一個新的“線性預測”(line prediction)層,它會教一個系統從....

      的頭像 新智元 發表于 12-29 09:11 ? 277次 閱讀
      谷歌新研究使用連續拍攝的一對非模糊圖像,能夠合成運動模糊圖像

      如何使用語義相關性與拓撲關系進行跨媒體檢索算法概述

      針對如何挖掘不同模態中具有相同語義的特征數據之間的內在相關性的問題,提出了一種基于語義相關性與拓撲關....

      發表于 12-28 17:04 ? 153次 閱讀
      如何使用語義相關性與拓撲關系進行跨媒體檢索算法概述

      如何使用局部近鄰標準化和動態主元分析進行故障檢測分析策略

      針對工業過程的動態和多模態特性,提出一種基于局部近鄰標準化( LNS)和動態主元分析(DPCA)相結....

      發表于 12-28 16:41 ? 64次 閱讀
      如何使用局部近鄰標準化和動態主元分析進行故障檢測分析策略

      數字電路教程之邏輯代數基礎課件資料免費下載

      本文檔的主要內容詳細介紹的是數字電路教程課件之邏輯代數基礎主要內容包括了:一 概述,二 邏輯代數中的....

      發表于 12-28 08:00 ? 67次 閱讀
      數字電路教程之邏輯代數基礎課件資料免費下載

      單片機教程之單片機開發技巧的詳細資料說明

      很多朋友正在學習單片機開發技術,但開發中免不了要碰到這樣、那樣的問題,有些問題可能無礙大局,但有一些....

      發表于 12-27 15:20 ? 300次 閱讀
      單片機教程之單片機開發技巧的詳細資料說明

      學習C語言可能會有哪些誤解

      我是在學習單片機的時候才真正知道C 語言是什么它是來干什么的~但是C 語言用到嵌入式只是它小小的一部....

      發表于 12-26 17:21 ? 268次 閱讀
      學習C語言可能會有哪些誤解

      面向“邊緣”應用的卷積神經網絡如何進行量化與壓縮詳細方法

      針對卷積神經網絡( CNN)推理計算所需內存空間和資源過大,限制了其在嵌入式等“邊緣”設備上部署的問....

      發表于 12-26 17:01 ? 82次 閱讀
      面向“邊緣”應用的卷積神經網絡如何進行量化與壓縮詳細方法

      圣誕節來臨,讓AI寫一支圣誕歌給你聽

      為了訓練這個網絡,研究團隊采用MIDI格式的100首圣誕歌曲的訓練數據集,包含每個音符的音高、長度和....

      的頭像 新智元 發表于 12-26 08:55 ? 408次 閱讀
      圣誕節來臨,讓AI寫一支圣誕歌給你聽

      SN54HC04和SN74HC04HEX逆變器的數據手冊免費下載

      這些裝置包括六個獨立的逆變器。它們在正邏輯中執行布爾函數Y=A。SN54HC04的特點是在-55℃至....

      發表于 12-26 08:00 ? 78次 閱讀
      SN54HC04和SN74HC04HEX逆變器的數據手冊免費下載

      請問一下這是什么函數,在哪里可以找到

      如題

      發表于 12-25 21:09 ? 84次 閱讀
      請問一下這是什么函數,在哪里可以找到

      阿里巴巴再度開放一份計算機集群的真實數據集(Alibaba Cluster Data V2018)

      究竟什么是 DAG?離線計算任務,例如 Map Reduce、Hadoop、Spark、Flink ....

      的頭像 人工智能見聞 發表于 12-25 16:31 ? 1098次 閱讀
      阿里巴巴再度開放一份計算機集群的真實數據集(Alibaba Cluster Data V2018)

      各個平臺各種行業的數據可視化分析工具大集合

      Openlayers可能是所有地圖庫中可靠性最高的一個。雖然文檔注釋并不完善。且學習曲線非常陡峭,但....

      的頭像 悟空智能科技 發表于 12-25 14:36 ? 273次 閱讀
      各個平臺各種行業的數據可視化分析工具大集合

      2018年最后10篇python熱文,完美收官!

      Clean Architecture in Python 旨在展示如何使用干凈的 python 架構....

      的頭像 電子發燒友網工程師 發表于 12-25 10:38 ? 412次 閱讀
      2018年最后10篇python熱文,完美收官!

      一種用于視頻識別的SlowFast網絡

      如上圖所示,SlowFast 網絡的整體結構,包含 Slow pathway、Fast pathwa....

      的頭像 電子發燒友網工程師 發表于 12-25 10:29 ? 348次 閱讀
      一種用于視頻識別的SlowFast網絡

      自動控制原理復習試卷資料免費下載

      本文檔的主要內容詳細介紹的是自動控制原理復習試卷和答案資料免費下載。

      發表于 12-25 08:00 ? 67次 閱讀
      自動控制原理復習試卷資料免費下載

      如何使用結合全局信息進行局部圖像灰度擬合模型

      針對局部圖像擬合( LIF)模型對初始輪廓大小、形狀和位置敏感的問題,提出一個結合全局信息的局部圖像....

      發表于 12-24 15:53 ? 150次 閱讀
      如何使用結合全局信息進行局部圖像灰度擬合模型

      如何進行多車型綠色車輛路徑問題來優化模型解決車輛產生的廢氣污染

      為降低物流配送過程中車輛產生的廢氣污染,在傳統帶時間窗車輛路徑問題(VRPTW)的基礎上,從節能減排....

      發表于 12-21 16:50 ? 42次 閱讀
      如何進行多車型綠色車輛路徑問題來優化模型解決車輛產生的廢氣污染

      如何使用連續離散問題聯合求解和群組分析進行多目標跟蹤技術研究

      多目標跟蹤技術通過對不同目標之間的相互社會關系進行建模,改善單個目標的跟蹤性能,并且快速檢測和預判場....

      發表于 12-21 15:03 ? 63次 閱讀
      如何使用連續離散問題聯合求解和群組分析進行多目標跟蹤技術研究

      如何將多核模糊聚類算法與屬性加權核模糊聚類算法相結合

      針對多數據源或異構數據集,采用單個核函數的聚類效果不理想的問題,以及考慮到不同屬性對不同類別重要性的....

      發表于 12-21 15:03 ? 140次 閱讀
      如何將多核模糊聚類算法與屬性加權核模糊聚類算法相結合

      如何使用Q學習算法進行X光主動視覺的安檢方法資料說明概述

      針對主動視覺安檢方法檢測性能不高和檢測速度慢的問題,基于Q學習(QL)算法提出了采用狀態回溯的啟發式....

      發表于 12-21 15:03 ? 37次 閱讀
      如何使用Q學習算法進行X光主動視覺的安檢方法資料說明概述

      數獨算法概述和數獨的計算機和并行求解

      本文檔的主要內容詳細介紹的是數獨算法概述和數獨的計算機和并行求解主要內容包括了:1.數獨的由來2.數....

      發表于 12-21 10:37 ? 49次 閱讀
      數獨算法概述和數獨的計算機和并行求解

      詳細介紹人工智能領域工作所要求的行業技能

      您可以采用人工分類的標記數據,并通過機器學習擴展邏輯,或讓計算機瀏覽未標記的數據并為您解決問題。您可....

      的頭像 將門創投 發表于 12-21 10:00 ? 368次 閱讀
      詳細介紹人工智能領域工作所要求的行業技能

      Facebook 5年走過的坑,希望你能繞過去

      如果研究院和產品團隊脫節,研究院的那幫高智商的瘋子們,什么事情都能做得出來。他們關注的問題,可能在學....

      的頭像 新智元 發表于 12-20 09:36 ? 400次 閱讀
      Facebook 5年走過的坑,希望你能繞過去

      如何根據霧濃度進行圖像去霧的方法說明

      在霧、霾等惡劣天氣條件下,由于空氣中渾濁介質對大氣光的吸收、反射等作用,獲取到的圖像出現霧化現象,對....

      發表于 12-19 16:46 ? 33次 閱讀
      如何根據霧濃度進行圖像去霧的方法說明

      如何使用馬爾可夫鏈與服務質量提高網絡可用性的性能模型說明

      針對網絡可用性在不同網絡業務中的服務質量( QoS)存在差異,且與性能花費相互制約的問題,引入了馬爾....

      發表于 12-19 14:53 ? 32次 閱讀
      如何使用馬爾可夫鏈與服務質量提高網絡可用性的性能模型說明

      如何使用自適應組合核的魯棒視頻進行目標跟蹤算法說明

      為了解決核化相關濾波器( KCF)在復雜場景下魯棒性差的問題,提出了基于自適應組合核(SACK)的目....

      發表于 12-19 14:05 ? 38次 閱讀
      如何使用自適應組合核的魯棒視頻進行目標跟蹤算法說明

      如何構建接口智能模型的函數詳細資料說明

      本文旨在通過接口智能模型,使用函數方法,構建成適應需求的整體程序。在《接口模型的算法表示和使用例子》....

      發表于 12-19 14:05 ? 154次 閱讀
      如何構建接口智能模型的函數詳細資料說明

      如何使用改進GM模型進行房價預測模型資料說明

      本文將以青島西海岸新區商品房價格為例,針對商品房價格呈現動態變化的特點,利用改進的GM (1, 1)....

      發表于 12-19 11:44 ? 30次 閱讀
      如何使用改進GM模型進行房價預測模型資料說明

      數據并行化對神經網絡訓練有何影響?谷歌大腦進行了實證研究

      神經網絡訓練硬件具備越來越強大的數據并行化處理能力。基于 GPU 或定制 ASIC 的專門系統輔以高....

      的頭像 人工智能 發表于 12-19 10:39 ? 510次 閱讀
      數據并行化對神經網絡訓練有何影響?谷歌大腦進行了實證研究

      如何使用小波變換的通信信號進行特征提取與調制識別的資料概述

      通信信號調制識別目的就是對截獲的一段通信信號,依據較少的先驗信息,判斷出信號的調制方式。隨著通信技術....

      發表于 12-19 10:36 ? 33次 閱讀
      如何使用小波變換的通信信號進行特征提取與調制識別的資料概述

      清洗誤標注的開發集和測試集樣本

      在進行誤差分析時,你可能會注意到一些開發集的樣本被誤標注(mislabeled )了。此處的“誤標注”指的是圖像在使用算法處理前,已...

      發表于 12-19 09:48 ? 94次 閱讀
      清洗誤標注的開發集和測試集樣本

      MySQL入門教程課件和筆記及函數等資料合集免費下載

      本文檔的主要內容詳細介紹的是MySQL入門教程課件和筆記及函數等資料合集免費下載主要內容包括了:1.....

      發表于 12-19 08:00 ? 40次 閱讀
      MySQL入門教程課件和筆記及函數等資料合集免費下載

      遺傳算法如何進行設計和其并行的實現

      遺傳算法(Genetic Algorithm-- GA) ,是模擬達爾文的遺傳選擇和自然淘汰的生物進....

      發表于 12-18 16:11 ? 40次 閱讀
      遺傳算法如何進行設計和其并行的實現

      數據庫教程之如何進行數據查詢的詳細資料說明

      本文檔的主要內容詳細介紹的是數據庫教程之如何進行數據查詢的詳細資料說明主要內容包括了:1 單表查詢2....

      發表于 12-18 15:07 ? 22次 閱讀
      數據庫教程之如何進行數據查詢的詳細資料說明

      如何將STM32單片機中的函數調用到入口參數

      STM32—數組作為被調用函數的入口參數時,要兩個條件, 1:數組首地址 2:數組長度 ....

      發表于 12-18 15:05 ? 76次 閱讀
      如何將STM32單片機中的函數調用到入口參數

      如何使用Python編寫一個國際象棋AI程序

      最近我用Python做了一個國際象棋程序并把代碼發布在Github上了。這個代碼不到1000行,大概....

      發表于 12-18 14:19 ? 52次 閱讀
      如何使用Python編寫一個國際象棋AI程序

      SDNet成為目前世界上唯一在CoQA領域內數據集上F1得分超過80%的模型,達到80.7%

      CoQA 數據集旨在體現人類對話中的特質,追求答案的自然性和問答系統的魯棒性。在CoQA 中,答案沒....

      的頭像 新智元 發表于 12-18 09:07 ? 451次 閱讀
      SDNet成為目前世界上唯一在CoQA領域內數據集上F1得分超過80%的模型,達到80.7%

      Linux技術應用課程設計的詳細實例資料說明

      本文檔的主要內容詳細介紹的是Linux技術應用課程設計的詳細實例資料說明。

      發表于 12-17 09:06 ? 50次 閱讀
      Linux技術應用課程設計的詳細實例資料說明

      如何使用多特征i-vector進行短語音說話人識別算法說明

      當測試語音時長充足時,單一特征的信息量和區分性足夠完成說話人識別任務,但是在測試語音很短的情況下,語....

      發表于 12-14 13:42 ? 144次 閱讀
      如何使用多特征i-vector進行短語音說話人識別算法說明

      建立開發集和測試集(總結)

      ? 被選擇作為開發集和測試集的數據,應當與你未來計劃獲取并對其進行良好處理的數據有著相同的分布,而不一定和訓練集的數據分布...

      發表于 12-14 10:56 ? 124次 閱讀
      建立開發集和測試集(總結)

      如何使用差分隱私保護進行譜聚類算法

      針對傳統的聚類算法存在隱私泄露的風險,提出一種基于差分隱私保護的譜聚類算法。該算法基于差分隱私模型,....

      發表于 12-14 10:54 ? 32次 閱讀
      如何使用差分隱私保護進行譜聚類算法

      何時修改開發集、測試集和指標

      每當開展一個新項目時,我會盡快選好開發集和測試集,因為這可以幫團隊制定一個明確的目標。 我通常會要求我的團隊在不到一周...

      發表于 12-14 10:54 ? 114次 閱讀
      何時修改開發集、測試集和指標

      如何使用多變異策略進行自適應差分進化算法的詳細資料說明

      為了克服差分進化算法尋優精度低、收斂速度慢、穩定性差等不足,提出一種基于多變異策略的自適應差分進化算....

      發表于 12-14 10:54 ? 31次 閱讀
      如何使用多變異策略進行自適應差分進化算法的詳細資料說明

      如何使用負載牽引和記憶效應的X參數進行功放建模

      為了更加快速準確地描述帶有記憶效應的射頻功率放大器,基于傳統的X參數模型,結合負載牽引和功放的記憶效....

      發表于 12-13 17:08 ? 52次 閱讀
      如何使用負載牽引和記憶效應的X參數進行功放建模

      UCOS-III教程之UCOS-III學習筆記資料免費下載

      一知識要點 1.用戶代碼不允許調用任務函數,任務一旦創建只能由UCOS-III調用 2.每個任務....

      發表于 12-13 16:45 ? 48次 閱讀
      UCOS-III教程之UCOS-III學習筆記資料免費下載

      通過開發集和度量指標加速迭代

      對于當前面臨的新問題,我們很難提前知道使用哪種方法會是最合適的,即使是一個經驗豐富的機器學習研究員,通常也需要在嘗試多種...

      發表于 12-13 14:06 ? 228次 閱讀
      通過開發集和度量指標加速迭代

      Linux內核同步機制之原子操作

      從上面的定義來看,atomic_t實際上就是一個int類型的counter,不過定義這樣特殊的類型a....

      的頭像 Linuxer 發表于 12-13 14:05 ? 444次 閱讀
      Linux內核同步機制之原子操作

      基于改進模糊熵和證據推理的多屬性決策方法

      針對證據推理方法框架下屬性權重難以獲取的問題,提出一種基于改進模糊熵和證據推理的多屬性決策方法。首先....

      發表于 12-13 11:40 ? 35次 閱讀
      基于改進模糊熵和證據推理的多屬性決策方法

      如何使用概率模型進行非均勻數據聚類算法的設計介紹

      針對傳統K-means型算法的“均勻效應”問題,提出一種基于概率模型的聚類算法。首先,提出一個描述非....

      發表于 12-13 10:57 ? 37次 閱讀
      如何使用概率模型進行非均勻數據聚類算法的設計介紹

      數據科學高效工具:feature-selector,幫你快速完成特征選擇

      該方法以及之后的identify_low_importance都只適用于監督學習(即需要label,....

      的頭像 人工智能愛好者社區 發表于 12-13 09:56 ? 304次 閱讀
      數據科學高效工具:feature-selector,幫你快速完成特征選擇

      如何在__delay_ms()和__delay_us()函數中傳遞參數而不是數字?

      我想在這個函數中傳遞這個論點。有可能嗎? 以上來自于百度翻譯       以下為原文   &nbs...

      發表于 12-10 16:28 ? 51次 閱讀
      如何在__delay_ms()和__delay_us()函數中傳遞參數而不是數字?

      開發集和測試集應該有多大?

      開發集的規模應該盡可能的大,至少要能夠區分出你所嘗試的不同算法之間的性能差異。例如,如果分類器 A 的準確率為 90.0% ,而分...

      發表于 12-10 10:23 ? 192次 閱讀
      開發集和測試集應該有多大?

      開發集和測試集應該服從同一分布

      根據公司的核心市場分布情況,你將貓咪app的圖像數據劃分為“美國”、“中國”、“印度”和“其它地區”四個區域。在設立開發集和...

      發表于 12-10 10:15 ? 187次 閱讀
      開發集和測試集應該服從同一分布

      深度學習中開發集和測試集的定義

      繼續分析我們之前提到的貓咪圖片的案例:現在你負責運營一個移動端 app,用戶會向這個app 上傳許多不同內容的圖片。而你希望這個...

      發表于 11-30 16:58 ? 376次 閱讀
      深度學習中開發集和測試集的定義

      不知道這些函數對應的數學表達式

      不理解這些是什么函數,能給出數學表達式嗎

      發表于 11-29 15:24 ? 83次 閱讀
      不知道這些函數對應的數學表達式
      上海快3开奖走势图
      <em id="0s9ur"></em>

      <em id="0s9ur"></em>
      <div id="0s9ur"><ol id="0s9ur"></ol></div>
      <div id="0s9ur"><tr id="0s9ur"><object id="0s9ur"></object></tr></div>

          <dl id="0s9ur"><ins id="0s9ur"><small id="0s9ur"></small></ins></dl>
          <em id="0s9ur"></em>

          <em id="0s9ur"></em>
          <div id="0s9ur"><ol id="0s9ur"></ol></div>
          <div id="0s9ur"><tr id="0s9ur"><object id="0s9ur"></object></tr></div>

              <dl id="0s9ur"><ins id="0s9ur"><small id="0s9ur"></small></ins></dl>