新浪筆試題之數據挖掘題

20xx新浪筆試題難嗎?你還為找不到真題而煩惱嗎?下面就由本站小編為大家介紹一下20xx新浪筆試題之數據挖掘題的文章,歡迎閲讀。

新浪筆試題之數據挖掘題

20xx新浪筆試題之數據挖掘題篇1

1.鏈表使用情形

刪除和添加操作比較多的時候

2.一個網絡,包含6個子網,子網中最多有26台主機,問子網掩碼是多少?

26台主機,所以需要5個位置保存主機號。因為25=32

6個子網,所以需要3個位置保存子網號。因為23=8

11111111, 11111111, 1111 1111, ×××

子網號 主機號

子網掩碼的二進制形式:

11111111, 11111111, 11111111, 11100000

轉化成十進制:

3.數據挖掘中的apri***算法,何時剪枝?

Apriori算法在產生頻繁集之後,根據最小支持度剪枝,小於supmin的樹枝將被剪掉。

x中如何查看系統磁盤空間?

df

查看進程信息 :ps

查看系統資源(CPU,內存,文件描述符的佔用情況)使用信息:top

5.如何查看DNS服務器的ip地址?

在cmd中nslookup,(windows和linux都好使),則出現本機的default server 和address。

接着輸入set querytype=NS,然後就可以輸入要查的服務器的域名了。比如:,結果如下:

>

Server:

Address:

Non-authoritative answer:

nameserver =

nameserver =

nameserver =

nameserver =

internet address =

internet address =

internet address =

internet address =

20xx新浪筆試題之數據挖掘題篇2

面向連接還是無連接?面向對象還是面向記錄?

應用層 無連接,不保存狀態

傳輸層 TCP

網絡層 IP

數據鏈路層 PPP,以太網,令牌環

物理層 雙絞線,同軸電纜,光纜,藍牙(2.4GHz,10m以內),wifi/802.11G協議(2.4Ghz),X.25

http即超文本傳輸協議,無連接,沒有會話,每次請求一次性報告完畢。

後面的問題不知道了。

2.木馬是蠕蟲嗎?防火牆可否有效地防止病毒?

木馬不是蠕蟲,防火牆也不可以防止病毒。

對於一台電腦,病毒的來源有:網頁(自己去訪問頁面被自動執行的那些東東)、移動設備(U盤、光盤、移動硬盤等那些和電腦有過數據交換,並且可以自身攜帶“程序”的設備,可能在你訪問設備或不訪問設備的時候悄悄進入電腦的)、不知名的(肯定是要聯網的嘛,比如QQ等在你聊天的時候偷偷溜進來的)。

防火牆根據源地址、目的地址、端口號判斷是否進行攔截,而不針對具體的內容進行分析。所以,如果從防火牆認為安全的端口傳播病毒,防火牆也是防不住的。

3.給定集合,找出支持度為3的關聯規則

感覺題目很是寬泛,沒有給出準確的集合。還有支持度是項集出現的概率,不應為整數吧

那就找出現過3次的頻繁集吧~,注意不是項集哦!

的作用?域名轉為ip地址

域名解析協議,將域名轉為IP地址

的作用?ip地址轉為物理地址

地址解析協議,將IP地址轉為物理地址

20xx新浪筆試題之數據挖掘題篇3

1.網頁中能保存用户名密碼的功能由什麼實現?cookie,(重複)

Cookie和歷史記錄

2.網頁訪問成功後返回的狀態值是?404還是304?

200訪問成功

301永久重定向

302重定向

404頁面不存在,沒有找到

500服務器內部錯誤

3.環比增長速度是12%,11%,13&,14%,那麼*基速度是多少?

各環比增長速度加1後連乘積再減1等於定基增長速度

先應將各環比增長速度加1換算成環比發展速度,然後再連乘換算成定基發展速度,最後再減1即得定基增長速度

故發展速度 : 1.12*1.11*1.13*1.14=1.6

定基增長速度為 60%

4.觀察事物的動態變換用什麼方法?指數,時間序列,頻率統計,迴歸方程?

首先記錄,記錄的形式有數據、圖片、聲音等各種信息,終歸結底是能夠被計算機識別和保存的那種方式。

然後比較,根據不同的屬性和維度。

再用各種數學方法進行分析。