全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

王海濤
0 評(píng)論 1237 瀏覽 2 收藏 7 分鐘

?本文介紹了從全球?qū)@麛?shù)據(jù)中構(gòu)建共現(xiàn)圖譜并對(duì)網(wǎng)絡(luò)中心度進(jìn)行測(cè)算方法,為產(chǎn)業(yè)研究提供了一種新的視角和工具,幫助用戶更有效地識(shí)別和分析技術(shù)領(lǐng)域的頂尖資源。

一、說(shuō)職場(chǎng)故事

招才引智、科研合作、科技攻關(guān)都有以下需求:

  • 找到某個(gè)技術(shù)領(lǐng)域的頂尖人才團(tuán)隊(duì)
  • 找到某個(gè)技術(shù)領(lǐng)域的頂尖科研機(jī)構(gòu)/企業(yè)

如何通過(guò)大數(shù)據(jù)挖掘的方式幫客戶實(shí)現(xiàn)這些需求呢?以下我們從全球?qū)@暯墙o出對(duì)應(yīng)答案。

二、共現(xiàn)圖譜構(gòu)建、中心度的測(cè)算

接下來(lái)我們主要講解如何從全球?qū)@姓业巾敿鈭F(tuán)隊(duì)、頂尖科研機(jī)構(gòu)/企業(yè),在進(jìn)入這個(gè)主題之前我們需要學(xué)習(xí)下共現(xiàn)圖譜知識(shí)。

從下圖我們可以看出,同一篇專利可能存在多個(gè)申請(qǐng)人、發(fā)明設(shè)計(jì)人、IPC分類號(hào)。

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

如果有100條專利,我們就可以根據(jù)這3個(gè)字段構(gòu)建共現(xiàn)關(guān)系。比如,以IPC為例,就可以構(gòu)建IPC共現(xiàn)圖譜:

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

在該圖中,節(jié)點(diǎn)的大小表示相應(yīng)分類號(hào)出現(xiàn)的頻次,節(jié)點(diǎn)越大,說(shuō)明100篇專利與該分類號(hào)相關(guān)的標(biāo)準(zhǔn)必要專利越多;節(jié)點(diǎn)之間的連線表示兩個(gè)分類號(hào)同時(shí)出現(xiàn)在一個(gè)標(biāo)準(zhǔn)必要專利中,連線越粗,代表兩個(gè)節(jié)點(diǎn)同時(shí)出現(xiàn)的次數(shù)越多,關(guān)系越密切。

社區(qū)發(fā)現(xiàn)是一種將網(wǎng)絡(luò)分成若干個(gè)社區(qū)的方法,根據(jù)其網(wǎng)絡(luò)中節(jié)點(diǎn)之間的聯(lián)系和相似性將節(jié)點(diǎn)劃分為不同的社區(qū),處于同一社區(qū)的節(jié)點(diǎn)之間更加相似、聯(lián)系更加緊密。

在社會(huì)網(wǎng)絡(luò)分析方法中,常見(jiàn)的衡量節(jié)點(diǎn)重要性的指標(biāo)有點(diǎn)度中心度、中介中心度、接近中心度特征向量中心度,可以根據(jù)這些中心度計(jì)算綜合中心度從而確定某個(gè)節(jié)點(diǎn)在整個(gè)網(wǎng)絡(luò)的重要性,各個(gè)中心度的說(shuō)明如下:

三、說(shuō)應(yīng)用場(chǎng)景

有了共現(xiàn)圖的構(gòu)建方法及網(wǎng)絡(luò)中心度的測(cè)算方法,在產(chǎn)業(yè)研究領(lǐng)域主要應(yīng)用場(chǎng)景有:

  • 找到某技術(shù)領(lǐng)域的頂尖人才團(tuán)隊(duì)
  • 找到某技術(shù)領(lǐng)域的頂尖科研機(jī)構(gòu)/企業(yè)
  • 找到某技術(shù)領(lǐng)域的核心技術(shù)

應(yīng)用場(chǎng)景一 :找到某個(gè)技術(shù)領(lǐng)域的頂尖人才團(tuán)隊(duì)

比如推薦人工智能領(lǐng)域5個(gè)頂尖人才團(tuán)隊(duì)

實(shí)施步驟 將人工智能和IPC體系做映射(或者根據(jù)關(guān)鍵詞制定搜索策略)形成專利數(shù)據(jù)集,在數(shù)據(jù)集基礎(chǔ)上構(gòu)建“專利發(fā)明人共現(xiàn)圖譜”,在共現(xiàn)圖譜中計(jì)算網(wǎng)狀人物中的綜合中心度,根據(jù)綜合中心度取TOP5作為團(tuán)隊(duì)領(lǐng)頭人,再將領(lǐng)頭人到共現(xiàn)圖譜中找合作最緊密人物,最終形成以領(lǐng)頭人的領(lǐng)域團(tuán)隊(duì),流程如下圖所示:全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

應(yīng)用場(chǎng)景二:找到某個(gè)技術(shù)領(lǐng)域的頂尖頂尖科研機(jī)構(gòu)/企業(yè)

比如推薦人工智能領(lǐng)域的頂尖的科研機(jī)構(gòu)團(tuán)隊(duì)

方法同上,只不過(guò)這次換成“申請(qǐng)人”構(gòu)建共現(xiàn)圖譜,這里可以分為二類:一類為研究機(jī)構(gòu)、一類為企業(yè),流程如下:

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

應(yīng)用場(chǎng)景三:找某個(gè)技術(shù)領(lǐng)域的核心技術(shù)

比如人工智能領(lǐng)域的核心技術(shù)有哪些

方法同上,這次根據(jù)專利所屬“IPC分類號(hào)”構(gòu)建共現(xiàn)圖譜,流程如下:

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

需要特別指出的是,如果需要對(duì)核心IPC進(jìn)一步凝練成技術(shù)短語(yǔ)的化,可以利用大模型語(yǔ)義理解和抽取能力做進(jìn)一步工作。

四、寫(xiě)在后面的話

本文主要介紹了共現(xiàn)圖譜的構(gòu)建方法、網(wǎng)絡(luò)中心度的測(cè)算方法,然后闡述了共現(xiàn)圖譜可以在產(chǎn)業(yè)研究領(lǐng)域的應(yīng)用場(chǎng)景。需要注意一下幾點(diǎn):

  1. 范圍可以不限于全球?qū)@?/strong>雖然講述的是全球?qū)@治鐾诰?,但該分析研究方法可以拓展到“頂刊”“全球?xiàng)目”數(shù)據(jù)的挖掘中。
  2. 在實(shí)際應(yīng)用中可以保持靈活性:比如本文用的“綜合中心度”代表節(jié)點(diǎn)的重要性,實(shí)際可以根據(jù)情況選取任意一個(gè)中心度作為重要性指標(biāo)。

本文由 @王海濤 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!