一:什么是散點(diǎn)圖 - What is a scatter plot
任何數(shù)據(jù)分析的第一步是圖形化曲線顯示數(shù)據(jù),根據(jù)相互關(guān)系,圖形曲線被稱為散點(diǎn)圖。散點(diǎn)圖可以表示兩個(gè)變量之間真實(shí)的關(guān)系強(qiáng)度,關(guān)系的趨勢(shì),是否存在 Outliers
二:散點(diǎn)圖的目的是什么
ü 觀察變量之間的關(guān)系,發(fā)現(xiàn)統(tǒng)計(jì)數(shù)據(jù)中是否存在問題,或者特殊值和感興趣的數(shù)據(jù)
ü 數(shù)據(jù)是如何被離散化的
ü 通過眼睛觀察是否存在 Outliers
三:示例說明
一個(gè)人的肺活量和屏住呼吸時(shí)間的研究,一個(gè)人能屏住呼吸多久,一個(gè)研究者選擇一組人作為研究對(duì)象,測(cè)量每個(gè)人的肺活量作為第一個(gè)變量,屏住呼吸時(shí)間作為第二個(gè)變量,研究者將使用散點(diǎn)圖來描述數(shù)據(jù),假設(shè)肺活量作為水平軸,屏住呼吸時(shí)間做為垂直軸。
四:代碼實(shí)現(xiàn)
基于 Java 開源的數(shù)據(jù)圖形顯示組件 -JFreeChart 已經(jīng)實(shí)現(xiàn)了離散圖,只要我們提供數(shù)據(jù)即可
基于上面描述的演示如下:
五:相關(guān)性系數(shù) correlation coefficient – R/r
|
Relationship Between X and Y Axis |
||
|
r = + 1.0 |
Strong - Positive |
As X goes up, Y always also goes up |
|
r = + 0.5 |
Weak - Positive |
As X goes up, Y tends to usually also go up |
|
r = 0 |
- No Correlation - |
X and Y are not correlated |
|
r = - 0.5 |
Weak - Negative |
As X goes up, Y tends to usually go down |
|
r = - 1.0 |
Strong - Negative |
As X goes up, Y always goes down |
本例中的 r 值為 0.9814324978439516, 顯然肺活量跟屏住呼吸時(shí)間長(zhǎng)短有很強(qiáng)的正相關(guān)性。
以下為源代碼:
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061
微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元

