摘要:
為推動AI的應用規范和準則設計,商湯科技于去年成立了AI倫理委員會,在公司內部產品審核等各項流程中嚴格進行AI倫理的審查,并在今年6月與上海交通大學清源研究院聯合發布《AI可持續發展白皮書》,為AI行業倫理發展提出規范性意見。與此同時,在產品的底層框架與技術研發的過程中,商湯科技也進行了前瞻探索,從根源上降低數據安全性隱患。
由于涉及隱私等…
|
為推動AI的應用規范和準則設計,商湯科技于去年成立了AI倫理委員會,在公司內部產品審核等各項流程中嚴格進行AI倫理的審查,并在今年6月與上海交通大學清源研究院聯合發布《AI可持續發展白皮書》,為AI行業倫理發展提出規范性意見。與此同時,在產品的底層框架與技術研發的過程中,商湯科技也進行了前瞻探索,從根源上降低數據安全性隱患。
由于涉及隱私等問題,全球各國都針對醫療數據制定了相關的保護政策,使得多中心數據共同訓練變得愈發困難,而這又是醫療AI模型開發迭代必須的步驟。近兩年異軍突起的“聯邦學習”,為這一問題提供了全新的解題思路。聯邦學習是一種分布式的機器學習方法,可以在不共享數據的情況下對多中心的數據進行聯合建模,從技術上實現了保證數據安全的同時實現協作。聯邦學習的提出受到了產、學、研各界的廣泛關注,成為AI領域的一項前沿課題。
依托深厚的學術研發底蘊以及對行業趨勢的敏銳洞察,商湯科技自2019年便開始了對聯邦學習的前瞻性研究,并于近日攜手美國羅格斯大學計算機系計算生物醫學成像和建模研究中心,在全球頂級計算機視覺會議ECCV(歐洲計算機視覺國際會議)上發表了一項新的研究成果,創新地使用基于分布式生成對抗網絡(GAN)的結構來實現聯邦學習,為打通AI醫療應用的最后一公里開辟出一條“新的道路”。
該研究通過將位于多個數據孤島的分布式異步鑒別器和一個中心生成器組成對抗網絡,讓中心生成器在不接觸原始隱私數據的情況下,也能進行合成訓練,從而能夠生成與各數據孤島中原始數據相近似的合成數據樣本,供下游任務使用。在此基礎上,還采用了2種損失函數,使得中心生成器具備一定的終身學習能力,可以在動態變化的數據孤島(鑒別器)環境中持續學習,比如學習過程中有新的機構加入或某些原有機構退出的情況。經試驗模擬,這套學習方法能夠從不同的數據孤島中漸進地學習到同類數據甚至不同類數據的近似分布,并在醫學圖像分割任務中,取得了較理想的效果。
由于避免了對原始數據的直接訪問,這套研究方法秉承了聯邦學習的核心優勢,很好地解決了醫療數據的隱私保護問題。不僅如此,相較于傳統的聯邦學習,由于在實現方法上“另辟蹊徑”,該研究成果還有效減少了中心與數據孤島之間的通信數據量,僅需傳輸合成圖像數據和反饋誤差而非整個模型的所有參數數據,而且各數據孤島之間無需交換任何數據或參數,因而可顯著降低醫療機構之間通過聯邦學習進行研究的成本,加快研究效率和AI模型的生產速度。
此外,這種創新、低成本的聯邦學習模式還可以推動低效率的分散型數據中心向高效的集約型數據網絡升級,從而更好地助力地區性數據中心或行業標準數據庫的建立。這正契合了國家“新基建”的戰略指導方針,加速“數據智能”的基礎設施建設,為醫療乃至更多行業節約成本,創造價值。
自AI在國內快速發展以來,國家陸續出臺了相關政策鼓勵AI產業發展, 推動了AI技術與產業的深度融合和落地應用,可持續發展的理念更將推動AI創新與應用的永續前行。對于醫療大健康行業,商湯科技將繼續以研究和應用雙擎驅動,橫向持續拓展SenseCare??智慧診療平臺能力服務更多臨床業務場景,縱向打通底層技術創新與上層應用的連接,在保證數據安全和患者隱私的基礎上,為醫療行業的數字化、智能化以及安全性等方面提供全方位助力,讓AI的價值不斷綻放,惠民利民。
正如金征宇教授在演講中所說,“相信醫學界能夠利用AI為自己插上一對理想的翅膀,為科學和人類發展做出更大貢獻。”
參考鏈接:https://www.sensetime.com/cn/product-detail?categoryId=51134040
|