Pythonによるデータ分析の教科書(その3)

3.数学の基礎
・数式と記号
ギリシャ文字:α、β、γ、δ・・・ω
集合:順番に関係なく、単なる数の集まりを表現
足し算の繰り返し:Σ
掛け算の繰り返し:Π
円周率:3.1415・・・
ネイピア数(自然対数の底)e:2.71828
関数:ex. f(x)=x**2+1
指数関数:f(x)=e**x
シグモイド関数:f(x) = 1/(1+e**(-x))
対数関数:f(x)=ln x (自然対数)
三角関数:sin x:正弦  cos x:余弦   tan x:正接
双曲線関数:sinhx  cosh x  tanh x

・線形代数
ベクトル:向きと長さを持った矢印として表現、丸括弧で数をまとめて表現 ex. (4,7)
横ベクトル:空間での位置を示す座標
縦ベクトル:向きと大木さんを持つ位置ベクトル
ベクトルの演算:要素同士の演算
ノルム:ベクトルの大きさをスカラーで表現、ユークリッド距離(L2ノルム)
マンハッタン距離:座標軸に沿って進んだ距離(L1ノルム)
内積:ドット積、計算結果はスカラー、要素通しの掛け算をすべて足し合わせた数
行列:行方向、列方向の広がりを持って数を並べたもの
正方行列:行取れるのサイズが同じ行列
単位行列:対角成分がすべて1,残りの要素が0の正方行列
行列の演算:要素通しの足し算、引き算
掛け算:掛けられる側の行列は、横ベクトルが並んだもの、掛ける側の行列は縦ベクトルが並んでいるもの
行列の分解 m x s の行列に s x n の行列を掛けると、m x n の行列になる

・基礎解析
微分:傾き
積分:面積
関数F(x)を微分して、f(x)になった時、Fをfの原始関数、fをFの導関数と呼ぶ
偏微分:不達以上の変数を持つ多変数関数をそれぞれの変数で微分(どの変数で微分したかを示す)

・確率と統計
代表値:最小値(minimum)、最大値(maximun)、平均値(mean)、中央値(median)、最頻値(mode)
ばらつきの指標
分散:すべてのデータの平均値からのズレを2乗して、データの個数で割った値
標準偏差:分散の平方根
度数分布表:データの最大値と最小値の間を等間隔に区切り(階数と呼ぶ)、階数ごとにいくつのデータがあるかをまとめたもの
ヒストグラム:度数分布表を棒グラフで表現したもの
箱ひげ図:ボックスプロット、箱の中の白線:中央値、箱の下:第1四分位数、箱の上:第3四分位数、上のひげ:最大値、下のひげ:最小値(外れ値を表現する流儀もある)
散布図:2種類のデータをx軸とy軸に割り当てて図示したもの
相関係数:共分散(それそれの変数について平均値との差を掛け算)を2つの変数の標準偏差で割った値
確率:ある事象が全事象に対して起きる確率
条件付き確率:ある事象が起きたという条件のもとで。その事象が起きる確率、ベイズの霊地の基本
確率分布:確率変数Xが起きる確率の分布
期待値:データの平均と同じ
確率と関数
確率質量分布(離散的)、確率密度分布(連続的)
正規分布(ガウス分布):平均が0,分散が1の正規分布を標準正規分布という

 

参考にした書籍
タイトル:Pythontによるデータ分析の教科書
著者:寺田学、辻真吾、鈴木たかのり、福島真太朗
発行所:株式会社 翔泳社

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください