夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網易首頁 > 網易號 > 正文 申請入駐

【小白掃盲】到底什么是數據(data)?

0
分享至

什么是數據?

簡單來說,數據是信息的一種載體。更嚴謹一點,我們也可以說,數據是客觀世界中被記錄、存儲的原始符號或信息。

在目前我們所處的時代,通常所說的數據,都是指計算機系統(tǒng)里的那些文本、圖片、音頻、視頻文件,那些二進制的0和1。


整個計算機系統(tǒng),甚至整個數字世界,都是圍繞數據進行工作。CPU,計算數據。內存和硬盤,存儲數據。通信網絡,傳遞數據。

因此,在計算機科學中,數據被定義為:“所有能輸入計算機并被程序處理的符號的總稱”。

需要注意的是,數據本身是沒有意義的,是未經加工的“原材料”。經過處理和分析之后,數據才能轉化為有意義的信息。

也有人指出,信息是數據經過處理后的結果,是對數據的解釋和賦予意義的產物。這句話雖然有點抽象(燒腦),但準確地表達了數據和信息之間的關系。

數據的特性

數據有很多特性。小棗君初步統(tǒng)計了一下,就有14個,分別是——

符號性:數據以符號形式存在,例如數字,以及剛才提到的文字、圖像、音頻、視頻等。

客觀性:數據反映了現實世界事物的屬性、狀態(tài)、關系等情況。它是客觀存在的,不隨主觀意志而改變。

量化性:數據通常以量化的形式存在,便于計數、測量和統(tǒng)計分析。

可比性:數據之間可以進行對比分析,通過比較可以揭示數據之間的關系和差異。

可傳遞性:數據可以通過各種方式進行傳輸,如電子文檔、紙質報告等,使得信息能夠在不同個體或組織間傳遞。

可存儲性:數據可以被存儲在數據庫、文件系統(tǒng)或其他存儲介質中,以便于未來的訪問和使用。

可處理性:數據可以通過計算、分析、加工等手段進行處理,以提取有用信息或轉化為知識。

多維度:數據可以從多個角度進行觀察和分析,如時間、空間、類別等多個維度。

多樣性:數據有多種多樣的類別和形式,能夠滿足不同領域和需求。

時效性:數據可能隨時間的推移而發(fā)生變化,某些數據在特定時間點之后可能失去價值或準確性。

可靠性:數據應該是可靠的,即數據的來源、收集方法和處理過程應該是可信的,以保證數據的準確性。

相關性:數據之間存在相關性,某些數據的變化可能會影響其他數據的表現。

可解釋性:數據應該能夠被解釋和理解,其背后的意義和代表的現實世界情況應該清晰。

限制性:數據可能受到隱私、法律、倫理等因素的限制,使用數據時需要遵守相關規(guī)范。


以上這么多的特性,在現實情況中,并不能都滿足。

例如,在追求數據時效性的同時,可能需要犧牲部分可存儲性。因為實時數據的收集和處理,需要更高的空間和成本。

同樣,為了提高數據的可靠性,可能需要投入更多的資源進行數據驗證和清洗,這可能會增加數據處理的復雜性和時間成本。

總之,能夠盡可能地滿足更多特性的數據,就會被認為是高質量的數據。數據的價值,也就更大。在實際應用中,我們需要根據具體場景和需求,權衡數據的各個特性,加以利用。

數據的分類方式

剛才在說數據特性的時候,提到數據有多樣性的特點,也就是有多種形式和類別。

對數據有很多種分類方式。例如,現在最常用的,就是按結構進行分類,包括結構化數據、半結構化數據和非結構化數據。

結構化數據,是指可以用預先定義的數據模型表述,或者,可以存入關系型數據庫的數據。例如,一個班級所有人的年齡、一個超市所有商品的價格,這些都是結構化數據。

結構化數據

非結構化數據,指網頁文章、郵件內容、圖像、音頻、視頻等。

半結構化數據,介于結構化和非結構化數據之間。如XML、JSON等格式的數據,它們有一定的組織形式,但不如結構化數據那樣嚴格。

目前,非結構化數據的占比是最高的。例如,在互聯(lián)網領域里,非結構化數據的占比已經超過了80%。

根據數據的來源,也可以分類。

例如,企業(yè)所產生的營銷數據、業(yè)務系統(tǒng)數據、生產數據等,互聯(lián)網行業(yè)所產生的社交內容數據、訂單數據、用戶數據等,政府部門所產生的社會治理數據、地理數據、經濟數據,等等。


根據數據的性質,還可以分為定位數據(描述空間位置,如坐標)、定性數據(描述事物屬性,如“陰雨天氣”)、定量數據(反映數量特征,如長度、重量)、定時數據(記錄時間特征,如日期、時刻)等。

總之,每種分類方式都有其特定的應用場景和價值。

了解數據的分類,有助于我們更好地理解數據的本質,以及如何在不同場景下有效地管理和利用數據。

數據的度量方式

前面我們也提到,數據具有量化性的特點。也就是說,數據是可以度量的。

我們通常度量數據的單位,大家應該比較熟悉,就是KB、MB、GB、TB等。

我們傳統(tǒng)PC和手機處理的數據,是GB/TB級別。例如,我們的硬盤,現在通常是1TB/2TB/4TB的容量。

在TB之上,還有PB、EB、ZB等。

TB、GB、MB、KB的關系,如下:

1 KB = 1024 B (KB - kilobyte)

1 MB = 1024 KB (MB - megabyte)

1 GB = 1024 MB (GB - gigabyte)

1 TB = 1024 GB (TB - terabyte)

1 PB = 1024 TB (PB - petabyte)

1 EB = 1024 PB (EB - exabyte)

1 ZB = 1024 EB (ZB - zettabyte)

只是看這幾個字母的話,貌似不是很直觀。我來舉個例子吧。

1TB,只需要一塊硬盤可以存儲。容量大約是20萬張照片或20萬首MP3音樂,或者是20萬部電子書。


1PB,需要大約2個機柜的存儲設備。容量大約是2億張照片或2億首MP3音樂。如果一個人不停地聽這些音樂,可以聽差不多兩千年。

1EB,需要大約2000個機柜的存儲設備。如果并排放這些機柜,可以連綿1.2公里那么長。如果擺放在機房里,需要21個標準籃球場那么大的機房,才能放得下。

阿里、百度、騰訊這樣的互聯(lián)網巨頭,數據量據說已經接近EB級。目前全人類的數據量,是ZB級。


數據中心

根據IDC的數據,在2020年,全球創(chuàng)建、捕獲、復制和消耗的數據總量約為64ZB。而到了2025年,全球數據總量可能會達到驚人的163ZB。如果建一個機房來存儲這些數據,那么,這個機房的面積將比196個鳥巢體育場還大。

數據的產生階段

人類社會的數據體量不僅大,增長速度也很快——每年增長50%。也就是說,每兩年就會增長一倍多。

為什么會如此之快?

說到這里,就要回顧一下人類社會數據產生的三個重要階段。

第一個階段,是1940-1990年。

計算機和數據庫被發(fā)明之后,數據管理的復雜度大大降低。各行各業(yè)開始產生了計算機數據,并記錄在數據庫中。這時的數據,以結構化數據為主(待會解釋什么是結構化數據)。數據的產生方式,是被動的。

第二個階段,是1990-2010年。

伴隨著互聯(lián)網的爆發(fā),網絡內容開始迅速增長,增加了很多的專業(yè)輸出內容(PGC)。Web2.0出現后,人們開始使用博客、facebook、youtube這樣的社交網絡,輸出大量的用戶原創(chuàng)內容(UGC),從而主動產生了大量的數據。移動智能終端時代的到來,也加速了該階段數據的產生。

第三個階段,是2010年至今。

隨著物聯(lián)網的發(fā)展,各種各樣的感知層節(jié)點(例如遍布各個角落的傳感器、攝像頭)開始自動產生大量的數據。企業(yè)的數字化轉型,構建了大量的系統(tǒng),沉淀和管理這些數據。人類的數據總量,再次躍升。


經過了“被動-主動-自動”這三個階段的發(fā)展,最終導致了人類數據總量的爆炸式膨脹。

值得一提的是,如今,隨著我們逐漸進入AI智能時代,很可能會迎來第四次數據暴增階段。以AIGC為代表的智能機器生產內容,正在急劇增加。

數據的作用和意義

數據是信息的載體。它的最基礎作用,就是記錄和表征。

例如,考勤數據,記錄了員工每天的上下班時間、請假、遲到、早退等信息。這些數據不僅幫助我們了解員工的出勤情況,還能進一步分析員工的工作效率、團隊協(xié)作以及可能存在的管理問題。

再例如,體檢數據,記錄了我們的身高、體重、血壓、血糖等各項生理指標。這些數據不僅有助于我們了解自身的健康狀況,還能及時發(fā)現潛在的健康問題,為預防和治療疾病提供重要依據。


除了個人工作和生活領域之外,在科學、商業(yè)和公共管理領域,都有對應的系統(tǒng)和數據。這個數據的體量更大,甚至達到了大數據的級別。

通過深入挖掘和分析海量的數據,企業(yè)和政府部門可以找到隱藏在數據背后的規(guī)律和趨勢,為未來的發(fā)展和決策提供有力的支持。


科學領域,實驗數據、觀測數據、模擬數據等構成了科學研究的基礎。這些數據不僅幫助科學家驗證理論、發(fā)現新現象,還能推動科學技術的進步和創(chuàng)新。

例如,天文學中的天文觀測數據,記錄了星系的運動、恒星的誕生和消亡等宇宙現象,這些數據為理解宇宙的起源和演化提供了重要線索。


商業(yè)領域,銷售數據、客戶數據、市場數據等是企業(yè)運營和決策的重要依據。通過分析這些數據,企業(yè)可以了解市場需求、優(yōu)化產品設計、提升客戶滿意度,從而制定更為精準的市場策略和商業(yè)計劃。

例如,電商平臺通過分析用戶的購買歷史和瀏覽行為,可以為用戶推薦更為符合其需求的商品,提升用戶的購物體驗和平臺的銷售額。


公共管理領域,政府數據、公共服務數據、社會調查數據等是政策制定和實施的基礎。這些數據不僅幫助政府了解社會現狀、預測發(fā)展趨勢,還能為政策評估和優(yōu)化提供依據。

例如,通過分析交通流量數據,政府可以合理規(guī)劃交通路線、優(yōu)化公共交通服務,從而緩解城市交通擁堵問題。


最后的話

總而言之,數據在目前這個時代,已經變成了重要的無形資產,也被稱為“新石油”。

從個人生活到全球治理,數據都扮演著不可或缺的角色,已成為驅動效率提升、科學發(fā)現和社會進步的核心資源。

最近幾年愈演愈烈的AI浪潮,進一步推動了數據的價值提升。人工智能的三要素,其中一項,就是數據(另外兩個是算力和算法)。數據作為AI的“燃料”,其質量和數量直接決定了AI系統(tǒng)的性能和準確性。

未來,隨著數據規(guī)模的指數級增長和技術的持續(xù)突破,數據的價值將進一步釋放。

好啦,以上就是關于數據的基本常識。大家都搞明白了嘛?

想要了解更多關于數據的知識,可以看這里:

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
高速突發(fā)!一SUV失控撞向護欄翻滾多圈,車內女子被甩到空中!

高速突發(fā)!一SUV失控撞向護欄翻滾多圈,車內女子被甩到空中!

恪守原則和底線
2025-10-06 20:09:23
南京地鐵一女子聽人提到雞鳴寺,認為暗諷自己是“雞”,報警+飆臟話

南京地鐵一女子聽人提到雞鳴寺,認為暗諷自己是“雞”,報警+飆臟話

瑪麗姬絲
2025-10-06 09:07:12
沒想到這么快,幾個小時就舉了白旗,彈盡糧絕,不投降就沒命了!

沒想到這么快,幾個小時就舉了白旗,彈盡糧絕,不投降就沒命了!

科普100克克
2025-10-05 15:24:42
網友爆料新郎跳河后續(xù):60桌婚宴突然中斷,丈母娘在當地頗有名氣

網友爆料新郎跳河后續(xù):60桌婚宴突然中斷,丈母娘在當地頗有名氣

丫頭舫
2025-10-05 13:37:49
高市早苗曾是“精神小妹”,喜歡機車重金屬,仨孩子都是丈夫前妻所生

高市早苗曾是“精神小妹”,喜歡機車重金屬,仨孩子都是丈夫前妻所生

愛史紀
2025-10-05 00:50:33
后續(xù)!女子景區(qū)撿板栗殼,被民宿老板娘誣陷偷盜還賠錢,老板回應

后續(xù)!女子景區(qū)撿板栗殼,被民宿老板娘誣陷偷盜還賠錢,老板回應

奇思妙想草葉君
2025-10-06 15:54:55
身在曹營心在漢?薩拉赫的心已經完全不在利物浦了!

身在曹營心在漢?薩拉赫的心已經完全不在利物浦了!

田先生籃球
2025-10-06 20:15:45
“人體強大無比的防御系統(tǒng),為何不會‘倒戈’攻擊自身?”三位科學家因發(fā)現人體“安全警衛(wèi)”獲諾獎!

“人體強大無比的防御系統(tǒng),為何不會‘倒戈’攻擊自身?”三位科學家因發(fā)現人體“安全警衛(wèi)”獲諾獎!

紅星新聞
2025-10-06 20:26:40
中國這次為何直接得罪美國,也要派出軍艦援助委瑞內拉,原因曝光

中國這次為何直接得罪美國,也要派出軍艦援助委瑞內拉,原因曝光

軍哥風云說
2025-10-06 09:05:33
蘋果正式官宣:10月份,5款新品即將發(fā)布!

蘋果正式官宣:10月份,5款新品即將發(fā)布!

科技堡壘
2025-10-06 10:48:52
烏掌握“有力證據”,中國正在幫助俄羅斯轟炸烏,100%由中國制造

烏掌握“有力證據”,中國正在幫助俄羅斯轟炸烏,100%由中國制造

三分亮劍
2025-10-06 12:35:29
太慘了!湖北54歲女司機沖散人群:5死8傷,慘況曝出,目擊者發(fā)聲

太慘了!湖北54歲女司機沖散人群:5死8傷,慘況曝出,目擊者發(fā)聲

熱風追逐者
2025-10-05 22:27:52
“眼前一黑又一黑”,無錫大量上市!

“眼前一黑又一黑”,無錫大量上市!

江南晚報
2025-10-06 12:42:05
50歲私廚花50萬買下一輛移動宴會車:可同時容納200人吃席,每場宴席出場費3千元

50歲私廚花50萬買下一輛移動宴會車:可同時容納200人吃席,每場宴席出場費3千元

大風新聞
2025-10-06 13:32:03
罕見!日本教練:重慶隊球員用日語沖我大罵,這還是運動員嗎?

罕見!日本教練:重慶隊球員用日語沖我大罵,這還是運動員嗎?

邱澤云
2025-10-06 15:54:18
梅西雖然助攻帽子戲法,但賽后情緒不高!大概是因為球隊沒奪冠!

梅西雖然助攻帽子戲法,但賽后情緒不高!大概是因為球隊沒奪冠!

氧氣是個地鐵
2025-10-06 17:17:30
要求退貨!上海隊球迷怒噴張鎮(zhèn)麟水貨,想退給遼寧,盧偉不留情面

要求退貨!上海隊球迷怒噴張鎮(zhèn)麟水貨,想退給遼寧,盧偉不留情面

宗介說體育
2025-10-06 13:06:05
重磅:烏克蘭摧毀克里米亞最大油庫!俄軍機場遇襲爆炸

重磅:烏克蘭摧毀克里米亞最大油庫!俄軍機場遇襲爆炸

項鵬飛
2025-10-06 20:14:03
青海通報:137人安全轉移,1人遇難

青海通報:137人安全轉移,1人遇難

政知新媒體
2025-10-06 13:12:16
孫儷白裙亮相Valentino,氣色紅潤,宋祖兒伴旁似丫鬟

孫儷白裙亮相Valentino,氣色紅潤,宋祖兒伴旁似丫鬟

暖心萌阿菇涼
2025-10-06 00:01:31
2025-10-07 02:35:00
鮮棗課堂 incentive-icons
鮮棗課堂
ICT知識科普。
941文章數 1255關注度
往期回顧 全部

科技要聞

2025年諾貝爾生理學或醫(yī)學獎揭曉

頭條要聞

5人進廢棄礦硐遇難 專家:廢棄礦硐如地下墳墓

頭條要聞

5人進廢棄礦硐遇難 專家:廢棄礦硐如地下墳墓

體育要聞

5天12場!王楚欽拼到低血糖 央視點贊

娛樂要聞

女星周也翻車!疑向熱巴翻白眼

財經要聞

暴漲前夜,大國博弈找到了新戰(zhàn)場!

汽車要聞

奇瑞全新大型SUV亮相!大六座+800V平臺

態(tài)度原創(chuàng)

游戲
教育
家居
手機
健康

亞洲邀請賽:WBG零封GAM,小天狂亮TES隊標

教育要聞

窮人的原生家庭就是一個精神病院

家居要聞

外灘壹號 知名導演豪宅

手機要聞

小米MIX Flip3再次被確認:新寬屏大R角,開始提速了!

內分泌科專家破解身高八大謠言

無障礙瀏覽 進入關懷版 中文字幕日韩有码国产| 少妇AVCOM| 国产成人综合A区| 少妇人妻在线视频| 少妇性荡欲视频| 狠狠色噜噜狠狠狠狠色综合久av| 影音先锋av资源网站| 可以直接免费看的AV| 日韩少妇无码XXXXXXX| 中国女人内谢69XXXXX首页| 中国裸体高清无码在线观看| 嫩草国产露脸精品国产软件| 天天鲁一鲁摸一摸爽一爽| 肉色欧美久久久久久久免费看| 亚洲精品国产综合久久久久紧| 亚洲第一国产综合| 欧美亚洲熟妇| 少妇与黑人一二三区无码| 免费的成年私人影院网站| 99久久精品国产一区二区蜜芽| 日韩中文字幕一二三视频| 欧美 亚洲精品 日本| 亚洲欧美精品aaaaaa片| 久久国产午夜精品理论片| 精品人妻中文字幕无码二区| 俄罗斯成人网站| 国产AV无码专区亚洲AV毛片搜| 一本加勒比HEZYO黑人| 欧美群交乱伦| 中文在线а天堂中文在线新版| 亚洲综合另类小说色区一| 久久久久久丝袜| 久久亚洲粉嫩高潮的18p| 亚洲一区二区三区精品无码av| 尤物网址在线看| 色av专区无码影音先锋| 奇米影视一二三区| 中文字幕在线视频免费| 中文字幕亚洲一区| 亚欧洲乱码视频一二三区| 亚洲激情成人小说|