呢幅圖中有三支裝住液體 嘅樽仔:樽仔 A 入便有幾多液體 一般會想像成連續變數,而枱上有幾多個樽仔 就一般會當係離散變數。 連續變數 (參見英文 :continuous )同離散變數 (參見英文 :discrete )係統計學 上嘅概念。一個連續變數嘅可能數值有無限 咁多個,而離散變數得若干個可能數值。例:真相 得兩個可能數值(真同假),但溫度 嘅可能數值嘅數量原則上有無限咁多個,攝氏 100 度、攝氏 100.01 度、攝氏 100.0001 度... 等等。
喺統計學 同各科學 入便,變數 係指一啲可以喺唔同觀察單位之間變化嘅特徵。例:一班學生之中,每個人嘅年齡 、身高 、語言 能力等都可能唔同,而呢啲特徵就可以叫做變數。年齡係一個變數,身高係一個變數,譬如阿明嘅年齡係十五歲而身高係 175 厘米,阿珍嘅年齡係十六歲而身高係 168 厘米... 如此類推。
變數可以按好多指標分類。一種常見做法係將變數分為連續變數 同離散變數 兩大類。
連續變數 係指可以喺某個範圍內可以攞任意嘅數值,理論上有無限咁多個可能數值,而且可以無限細分,是但攞兩個可能數值嚟睇,佢哋之間嘅差異都有可能再斬細橛啲。例如身高可以係 170 cm 170.5 cm 170.55 cm,甚至更細,總之中間冇任何「跳格」。包括體重 、溫度 同血壓 等一般都會當係連續變數。離散變數 係指個變數只可以取某啲特定數值,通常係整數 ,冇得喺中間慢慢變。例如課室入面嘅學生人數可以係 20 21 22,但唔會話可以有 20.5 個學生;又例如擲六面骰 出嘅點數,只可以係 1 至 6,唔會話出現 4.3 點。啲數值之間係一格格噉「跳」住變。兩者喺統計分析 上都好重要。
中位數分割 [ 1] 係將連續變數變做離散變數 嘅一種方法;
-得出「屬組 1 定組 2」呢個離散變數,可以將一個原本係連續嘅變數做一啲離散變數先可以做嘅推論統計 分析(例如係ANOVA )。到咗 2020 年,中位數分割呢種做法廣受評擊,好多人都唔會接受呢種做法[ 2] 。
↑ 英文 :median split ↑ Iacobucci, D., Posavac, S. S., Kardes, F. R., Schneider, M. J., & Popovich, D. L. (2015). The median split: Robust, refined, and revived.Journal of Consumer Psychology , 25(4), 690-704.