一種根據(jù)特征選擇負(fù)載的方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于算法領(lǐng)域,尤其涉及一種根據(jù)特征選擇負(fù)載的方法和系統(tǒng)。
【背景技術(shù)】
[0002] 無論是傳統(tǒng)的物理機(jī)或者云計(jì)算中的虛擬集群,對于系統(tǒng)的優(yōu)化都非常重要。為 了適應(yīng)不同的應(yīng)用要求,對系統(tǒng)的優(yōu)化會采取不同的優(yōu)化方法。在這種情況下,首先需要對 物理機(jī)或者虛擬機(jī)進(jìn)行負(fù)載分類,根據(jù)其屬于CPU密集型,內(nèi)存密集型,IO密集型和網(wǎng)絡(luò)密 集型等分別采取不同的優(yōu)化方法,以提高效率。
[0003]負(fù)載分類方法是系統(tǒng)優(yōu)化的前提,其效率的好壞直接影響著系統(tǒng)優(yōu)化的效率。在 負(fù)載分類過程中,準(zhǔn)確度與效率是一個(gè)相互制約的因素,通常提高準(zhǔn)確度的同時(shí)意味著效 率的下降。
[0004] 在負(fù)載分類過程中,一般情況下,增加特征的維度可以提高分類的準(zhǔn)確度,但會降 低分類的效率。但盲目地增加特征的維度并不能提高準(zhǔn)確度,因?yàn)橛邢嚓P(guān)關(guān)系的特征維度 會相互影響并降低分類準(zhǔn)確率。所以在特征選擇中,需要選擇與分類相關(guān)度高的特征,避免 特征的盲目增加。
【發(fā)明內(nèi)容】
[0005] 鑒于此,本發(fā)明提供一種根據(jù)特征選擇負(fù)載的方法和系統(tǒng),以解決現(xiàn)有技術(shù)的負(fù) 載選擇效率低的技術(shù)問題。
[0006] 本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種根據(jù)特征選擇負(fù)載的方法,所述方法包括以下 步驟:
[0007] 對待處理特征數(shù)據(jù)進(jìn)行預(yù)處理;
[0008] 通過特征聚類算法對所述待處理特征數(shù)據(jù)進(jìn)行分類,并獲取各類的代表元;
[0009]根據(jù)互信息值和所述代表元,選擇高準(zhǔn)確度的特征對應(yīng)的負(fù)載。
[0010] 本發(fā)明實(shí)施例還提供一種根據(jù)特征選擇負(fù)載的系統(tǒng),所述系統(tǒng)包括:
[0011] 預(yù)處理單元,用于對待處理特征數(shù)據(jù)進(jìn)行預(yù)處理;
[0012] 代表元獲取單元,用于通過特征聚類算法對所述預(yù)處理單元處理的待處理特征數(shù) 據(jù)進(jìn)行分類,并獲取各類的代表元;
[0013] 負(fù)載選擇單元,用于根據(jù)互信息值和所述代表元獲取單元獲取的代表元,選擇高 準(zhǔn)確度的特征對應(yīng)的負(fù)載。
[0014] 本發(fā)明實(shí)施例,對待處理特征數(shù)據(jù)進(jìn)行預(yù)處理,通過特征聚類算法對待處理特征 數(shù)據(jù)進(jìn)行分類,獲取各類的代表元,根據(jù)互信息值和代表元,選擇高準(zhǔn)確度的特征對應(yīng)的負(fù) 載,提供了一種高效率的負(fù)載選擇方法和系統(tǒng),提高了負(fù)載選擇的效率。
【附圖說明】
[0015] 為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述 中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些 實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些 附圖獲得其他的附圖。
[0016] 圖1是本發(fā)明實(shí)施例提供根據(jù)特征選擇負(fù)載方法的流程圖;
[0017]圖2是本發(fā)明實(shí)施例提供的根據(jù)特征選擇負(fù)載系統(tǒng)的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0018] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。
[0019] 為了說明本發(fā)明所述的技術(shù)方案,下面通過具體實(shí)施例來進(jìn)行說明。
[0020] 實(shí)施例一
[0021] 如圖1所示為本發(fā)明實(shí)施例提供根據(jù)特征選擇負(fù)載方法的流程圖,所述方法包括 以下步驟:
[0022] 步驟S101,對待處理特征數(shù)據(jù)進(jìn)行預(yù)處理。
[0023] 在本發(fā)明實(shí)施例中,對待處理的特征數(shù)據(jù)進(jìn)行預(yù)處理,通過該預(yù)處理,可以獲取該 特征數(shù)據(jù)的有效數(shù)據(jù),該特征數(shù)據(jù)為負(fù)載在運(yùn)行時(shí)表現(xiàn)出的特征,該特征包括但不限于: CPU密集型、內(nèi)存密集型、IO密集型和網(wǎng)絡(luò)密集型。所述對待處理特征數(shù)據(jù)進(jìn)行預(yù)處理的步 驟,包括:
[0024] 1、通過粒度選擇將所述待處理特征數(shù)據(jù)組成數(shù)據(jù)矩陣。
[0025] 在本發(fā)明實(shí)施例中,對待處理特征數(shù)據(jù)進(jìn)行粒度選擇,即:取一段時(shí)間內(nèi)的特征數(shù) 據(jù),將不同時(shí)間的數(shù)據(jù)按行排列、同一時(shí)間的不同指標(biāo)數(shù)據(jù)按列排列,并將上述按行列排列 的數(shù)據(jù)組成數(shù)據(jù)矩陣。
【主權(quán)項(xiàng)】
1. 一種根據(jù)特征選擇負(fù)載的方法,其特征在于,所述方法包括以下步驟: 對待處理特征數(shù)據(jù)進(jìn)行預(yù)處理; 通過特征聚類算法對所述待處理特征數(shù)據(jù)進(jìn)行分類,并獲取各類的代表元; 根據(jù)互信息值和所述代表元,選擇高準(zhǔn)確度的特征對應(yīng)的負(fù)載。
2. 如權(quán)利要求1所述的方法,其特征在于,所述對待處理特征數(shù)據(jù)進(jìn)行預(yù)處理的步驟, 包括: 通過粒度選擇將所述待處理特征數(shù)據(jù)組成數(shù)據(jù)矩陣; 通過公5
對所述數(shù)據(jù)矩陣進(jìn)行正規(guī)化處理。
3. 如權(quán)利要求1所述的方法,其特征在于,所述通過特征聚類算法對所述待處理特征 數(shù)據(jù)進(jìn)行分類,并獲取各類的代表元的步驟,具體為: 計(jì)算所述特征之間的皮爾森相關(guān)系數(shù)PCC ; 根據(jù)所述PCC衡量特征之間的關(guān)聯(lián)性,并根據(jù)所述關(guān)聯(lián)性進(jìn)行聚類; 從各類別中選擇一個(gè)特征作為所述類別的代表元。
4. 如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)互信息值和所述代表元,選擇高準(zhǔn) 確度的特征對應(yīng)的負(fù)載的步驟,包括: 根據(jù)公?
i計(jì)算所述代表元的互信息值; 根據(jù)所述互信息值對所述代表元進(jìn)行排序; 根據(jù)所述排序選擇高準(zhǔn)確度的特征對應(yīng)的負(fù)載。
5. -種根據(jù)特征選擇負(fù)載的系統(tǒng),其特征在于,所述系統(tǒng)包括: 預(yù)處理單元,用于對待處理特征數(shù)據(jù)進(jìn)行預(yù)處理; 代表元獲取單元,用于通過特征聚類算法對所述預(yù)處理單元處理的待處理特征數(shù)據(jù)進(jìn) 行分類,并獲取各類的代表元; 負(fù)載選擇單元,用于根據(jù)互信息值和所述代表元獲取單元獲取的代表元,選擇高準(zhǔn)確 度的特征對應(yīng)的負(fù)載。
6. 如權(quán)利要求5所述的系統(tǒng),其特征在于,所述預(yù)處理單元,包括: 數(shù)據(jù)矩陣組成子單元,用于通過粒度選擇將所述待處理特征數(shù)據(jù)組成數(shù)據(jù)矩陣; 正規(guī)化處理子單元,用于通過公式
對所述數(shù)據(jù)矩陣組成子 單元組成的數(shù)據(jù)矩陣進(jìn)行正規(guī)化處理。
7. 如權(quán)利要求5所述的系統(tǒng),其特征在于,所述代表元獲取單元,包括: PPC計(jì)算子單元,用于計(jì)算所述特征之間的PCC ; 聚類子單元,用于根據(jù)所述PPC計(jì)算子單元計(jì)算的PCC衡量特征之間的關(guān)聯(lián)性,并根據(jù) 所述關(guān)聯(lián)性進(jìn)行聚類; 代表元獲取子單元,用于從所述聚類子單元計(jì)算的各類別中選擇一個(gè)特征作為所述類 別的代表元。
8.如權(quán)利要求5所述的系統(tǒng),其特征在于,所述負(fù)載選擇單元,包括: 互信息值計(jì)算子單元,用于根據(jù)公式
j計(jì) 算所述代表元的互信息值; 排序子單元,用于根據(jù)所述互信息值計(jì)算子單元計(jì)算的互信息值對所述代表元進(jìn)行排 序; 負(fù)載選擇子單元,用于根據(jù)所述排序子單元計(jì)算的排序選擇高準(zhǔn)確度的特征對應(yīng)的負(fù) 載。
【專利摘要】本發(fā)明適用于算法領(lǐng)域,提供了一種根據(jù)特征選擇負(fù)載的方法和系統(tǒng),所述方法包括:對待處理特征數(shù)據(jù)進(jìn)行預(yù)處理;通過特征聚類算法對所述待處理特征數(shù)據(jù)進(jìn)行分類,并獲取各類的代表元;根據(jù)互信息值和所述代表元,選擇高準(zhǔn)確度的特征對應(yīng)的負(fù)載。本發(fā)明實(shí)施例,對待處理特征數(shù)據(jù)進(jìn)行預(yù)處理,通過特征聚類算法對待處理特征數(shù)據(jù)進(jìn)行分類,獲取各類的代表元,根據(jù)互信息值和代表元,選擇高準(zhǔn)確度的特征對應(yīng)的負(fù)載,提供了一種高效率的負(fù)載選擇方法和系統(tǒng),提高了負(fù)載選擇的效率。
【IPC分類】G06F17-30
【公開號】CN104765804
【申請?zhí)枴緾N201510147870
【發(fā)明人】尹建偉, 林鵬翔, 趙新奎, 李瑩, 鄧水光, 吳健, 吳朝暉
【申請人】浙江大學(xué)
【公開日】2015年7月8日
【申請日】2015年3月31日