Python言語によるビジネスアナリティクス実務家のための最適化・統計解析・機械学習科学技術計算モジュール SciPy

Python言語によるビジネスアナリティクス実務家のための最適化・統計解析・機械学習科学技術計算モジュール SciPy
久保幹雄

SciPyとは様々な科学技術計算のための実装を含むモジュール群 bookpy/notebooks内で扱うモジュールは以下のとおり - optimize : 最適化と方程式の根（=解） - spatial : 計算幾何 - stats : 確率・統計 - interpolate : 補間 - integrate : 積分 - linalg : 線形代数 - cluster : クラスタリング - sparse : 疎行列

optimizeに含まれる非線形最適化のための関数
関数 pythonでこの関数を実装する Google検索からのplot

matplotlibとNumPyを用いてplotしてみる def f(x): 関数の定義 return x/(1+x**2) xx=np.linspace(-10,10,100) yy=f(xx) plot(xx,yy);None -10から10までを等間隔に 100等分した配列

関数の最小値を求める関数は1変数であるため minimize_scalarメソッドを用いる引数methodでアルゴリズムの選択 - Brent : Brent法 - Golden : 黄金分割法 - Bounded : 最適解の範囲を引数boundsで与えた場合のBrent法

print("Brent=========================") print(minimize_scalar(f, method='Brent')) print("Golden=========================") print(minimize_scalar(f, method='Golden')) print("Bounded=========================") print(minimize_scalar(f, bounds=(-2,0), method='Bounded')) アルゴリズムの選択解の範囲（区間）

問題1：区間における関数の最小値を求めよ fun: message: 'Solution found.' nfev: 27 status: 0 success: True x:

複数の変数をもつ関数をある初期解からの探索で最小化非凸な非線形関数の代表例：Rosenbrock関数

minimizeで用いることができる解法　引数 : method Nelder-Mead法（非線形最適化用の単体法） - BFGS法（準ニュートン法） - 信頼領域Newton共役勾配法

from scipy.optimize import minimize, rosen, rosen_der, rosen_hess x0 = [2.0 for i in range(5)] res = minimize(rosen, x0, method='Nelder-Mead') print(res.x) res = minimize(rosen, x0, jac=rosen_der, method='BFGS') res = minimize(rosen, x0, jac=rosen_der, hess=rosen_hess, method='trust-ncg') 初期解（5次元）解法によって必要な引数が異なることに注意勾配ベクトルヘッセ行列

問題2： Rosenbrock関数の最小化を初期値を変えて行え。 Rosenbrock関数は実行可能領域で定義されている関数である。この範囲外の初期値を与えるとどうなるか実験せよ。

制約付き最適化の例半径　　　の円内　　　　　　　　　　の制約下で線形関数　　　　　　を最大化　　　　　　　　　線形関数　　　　　　　　　を最小化

def f(x): return -x[0]-x[1] bnds = ((0, None), (0, None)) f = lambda x: -x[0]-x[1] con = {'type': 'ineq', 'fun': lambda x: -x[0]**2 - x[1]**2 + 2 } res = minimize(fun=f, x0=[2,2], method='COBYLA',constraints=con) print("COBYLA========= \n",res) res = minimize(fun=f, x0=[2,2], method='SLSQP',constraints=con) print("SLSQP========== \n",res)

def f(x): x[0]をx , x[1]をyと考える return -x[0]-x[1] bnds = ((0, None), (0, None)) f = lambda x: -x[0]-x[1] con = {'type': 'ineq', 'fun': lambda x: -x[0]**2 - x[1]**2 + 2 } res = minimize(fun=f, x0=[2,2], method='COBYLA',constraints=con) print("COBYLA========= \n",res) res = minimize(fun=f, x0=[2,2], method='SLSQP',constraints=con) print("SLSQP========== \n",res) 　　　　　　　　

def f(x): return -x[0]-x[1] bnds = ((0, None), (0, None)) f = lambda x: -x[0]-x[1] 無名関数lambdaで関数を定義 con = {'type': 'ineq', 'fun': lambda x: -x[0]**2 - x[1]**2 + 2 } res = minimize(fun=f, x0=[2,2], method='COBYLA',constraints=con) print("COBYLA========= \n",res) res = minimize(fun=f, x0=[2,2], method='SLSQP',constraints=con) print("SLSQP========== \n",res)

def f(x): return -x[0]-x[1] bnds = ((0, None), (0, None)) ((x下限, x上限),(y下限, x上限)) f = lambda x: -x[0]-x[1] con = {'type': 'ineq', 'fun': lambda x: -x[0]**2 - x[1]**2 + 2 } res = minimize(fun=f, x0=[2,2], method='COBYLA',constraints=con) print("COBYLA========= \n",res) res = minimize(fun=f, x0=[2,2], method='SLSQP',constraints=con) print("SLSQP========== \n",res)

type : 関数が等式の場合は eq 非負の不等式の場合は ineq fun : 制約を表す関数を定義 def f(x): return -x[0]-x[1] bnds = ((0, None), (0, None)) f = lambda x: -x[0]-x[1] con = {'type': 'ineq', 'fun': lambda x: -x[0]**2 - x[1]**2 + 2 } res = minimize(fun=f, x0=[2,2], method='COBYLA',constraints=con) print("COBYLA========= \n",res) res = minimize(fun=f, x0=[2,2], method='SLSQP',constraints=con) print("SLSQP========== \n",res)

def f(x): return -x[0]-x[1] bnds = ((0, None), (0, None)) f = lambda x: -x[0]-x[1] con = {'type': 'ineq', 'fun': lambda x: -x[0]**2 - x[1]**2 + 2 } res = minimize(fun=f, x0=[2,2], method='COBYLA',constraints=con) print("COBYLA========= \n",res) res = minimize(fun=f, x0=[2,2], method='SLSQP',constraints=con) print("SLSQP========== \n",res)

def f(x): return -x[0]-x[1] bnds = ((0, None), (0, None)) f = lambda x: -x[0]-x[1] con = {'type': 'ineq', 'fun': lambda x: -x[0]**2 - x[1]**2 + 2 } res = minimize(fun=f, x0=[2,2], method='COBYLA',constraints=con) print("COBYLA========= \n",res) res = minimize(fun=f, x0=[2,2], method='SLSQP',constraints=con) print("SLSQP========== \n",res) fun : 最小化させたい関数 x0 : 初期値 (x,y) = (2,2) method : 解法 constraints : 制約

問題3：鳥が放物線を描いて飛んでいる。いまの位置にいるカメラマンが、鳥との距離が最小の地点でシャッターを押そうとしている。鳥がどの座標に来たときにシャッターを押せば良いだろうか？制約が等式であるため、 minimizeの引数methodはSLSQP SLSQP========== fun: jac: array([ , , ]) message: 'Optimization terminated successfully.' nfev: 28 nit: 7 njev: 7 status: 0 success: True x: array([ , ])

大域的最適化と局所的最適化 - basinhopping(関数 , 初期解) 　焼きなまし法（アニーリング法） - brute(関数, 範囲）　力づく法大域的最適解局所的最適解

曲線へのあてはめ（最小2乗法） - 最小2乗法 : 測定で得られた数値の組の関係を近似した関数で表すとき、残差の二乗和を最小とするような係数を決定し、近似を行う方法 curve_fit(関数, data1, data2) * np.random.normal() 　標準正規分布に従う擬似乱数ベクトル

曲線へのあてはめ（関数の根・不動点を求める） - brentq(関数, 値1, 値2) : Brent法によって関数の値1と値2の間にある根を求める　* 関数の値の符号は異なる必要がある

Spatial 計算幾何学 - 幾何的問題 : 図形や空間に関する問題 spatialに含まれるクラス
計算機科学とは、幾何的問題を効率よく解くための基本アルゴリズムの体系化をめざす学問分野である　 - 幾何的問題 : 図形や空間に関する問題 spatialに含まれるクラス - K-d木 - 凸包 - Delaunay 3角形分割 - Voronoi図 - distanceモジュール

Spatial　計算幾何学 K-d木 K-d木（K-d Tree)とはK次元の平面空間にある点を保管するための空間分割データ構造である。二分木の一種で根とよばれる点を2つの子点に分割する操作を繰り返すことで得られる。

Spatial　計算幾何学 K-d木 K-d木（K-d Tree)とはK次元の平面空間にある点を保管するための空間分割データ構造である。二分木の一種で根とよばれる点を2つの子点に分割する操作を繰り返すことで得られる。右図は空間を中央値で分割するとき、最初の操作後の平面空間を二分木で表したもの

0 〜 1の一様乱数をもつ二次元ベクトルを1000個含む配列
Spatial　計算幾何学 points = np.random.rand(1000, 2) tree = KDTree(points) ball = tree.query_ball_point([0.5, 0.5], 0.1) plot(points[:,0], points[:,1], 'b+') plot(points[ball,0], points[ball,1], 'ro'); None 0 〜 1の一様乱数をもつ二次元ベクトルを1000個含む配列

Spatial　計算幾何学 points = np.random.rand(1000, 2) tree = KDTree(points) ball = tree.query_ball_point([0.5, 0.5], 0.1) plot(points[:,0], points[:,1], 'b+') plot(points[ball,0], points[ball,1], 'ro'); None KDTreeクラスのインスタンスオブジェクトは配列pointsを引数に要する点 (0.5,0.5)から距離0.1以内のすべての点のインデックスの配列を返す

Spatial　計算幾何学 points = np.random.rand(1000, 2) tree = KDTree(points) ball = tree.query_ball_point([0.5, 0.5], 0.1) plot(points[:,0], points[:,1], 'b+') plot(points[ball,0], points[ball,1], 'ro'); None 配列pointsに含まれるすべての要素の0番目

Spatial　計算幾何学 points = np.random.rand(1000, 2) tree = KDTree(points) ball = tree.query_ball_point([0.5, 0.5], 0.1) plot(points[:,0], points[:,1], 'b+') plot(points[ball,0], points[ball,1], 'ro'); None 配列ballに含まれるインデックスと同じインデックスもつ配列pointsの要素の0番目

Spatial　計算幾何学出力される画像

Spatial　計算幾何学凸包（Convex hull）とは、与えられたn次元Euclid空間内の点を含む最小の凸多面体 n次元の凸包はn-1次元の面から構成され、構成された図形は単体（simplex）になる

Spatial　計算幾何学 points = np.random.rand(30, 2) hull = ConvexHull(points) convex_hull_plot_2d(hull) print( hull.vertices )

0 〜 1の一様乱数をもつ二次元ベクトルを30個含む配列
Spatial　計算幾何学 points = np.random.rand(30, 2) hull = ConvexHull(points) convex_hull_plot_2d(hull) print( hull.vertices ) 0 〜 1の一様乱数をもつ二次元ベクトルを30個含む配列

Spatial　計算幾何学 points = np.random.rand(30, 2) hull = ConvexHull(points) convex_hull_plot_2d(hull) print( hull.vertices ) ConvexHullクラスはコンストラクタの引数に n次元の点の配列pointsを要する

Spatial　計算幾何学 points = np.random.rand(30, 2) hull = ConvexHull(points) convex_hull_plot_2d(hull) print( hull.vertices )

Spatial　計算幾何学 points = np.random.rand(30, 2) hull = ConvexHull(points) convex_hull_plot_2d(hull) print( hull.vertices ) 端点

Spatial　計算幾何学ボロノイ図（Voronoi diagram)とは、各点に近い空間で領域わけされた図である。（双対=ドロネー図）与えられた点を母点とよび、各母点に近い空間からなる領域をボロノイ領域とよぶ。

Spatial　計算幾何学 points = np.array([[0, 0], [0, 1], [0, 2], [1, 0], [1, 1], [1, 2], [2, 0], [2, 1], [2, 2]]) vor = Voronoi(points) fig = voronoi_plot_2d(vor) print( vor.vertices )

Spatial　計算幾何学 points = np.array([[0, 0], [0, 1], [0, 2], [1, 0], [1, 1], [1, 2], [2, 0], [2, 1], [2, 2]]) vor = Voronoi(points) fig = voronoi_plot_2d(vor) print( vor.vertices ) 8個の点(x,y)を含む配列pointsをnp.array で生成

生成した点データ（配列）をコンストラクタの引数に
Spatial　計算幾何学 points = np.array([[0, 0], [0, 1], [0, 2], [1, 0], [1, 1], [1, 2], [2, 0], [2, 1], [2, 2]]) vor = Voronoi(points) fig = voronoi_plot_2d(vor) print( vor.vertices ) 生成した点データ（配列）をコンストラクタの引数に

Spatial　計算幾何学 points = np.array([[0, 0], [0, 1], [0, 2], [1, 0], [1, 1], [1, 2], [2, 0], [2, 1], [2, 2]]) vor = Voronoi(points) fig = voronoi_plot_2d(vor) print( vor.vertices )

Spatial 計算幾何学問題4：右下図と同じボロノイ図をplotしなさい
from scipy.spatial import Voronoi, voronoi_plot_2d points = np.array([[1, 0], [1, 2], [2, 0], [2, 2]]) vor = Voronoi(points) fig = voronoi_plot_2d(vor) print( vor.vertices )

Spatial　計算幾何学問題5： Weber問題（教科書88p 6.1 最適化より）で与えられている表6.1中の家の位置をplotし、各家に近い領域で分けられたボロノイ図を描画せよ。本問題　問1を解け。本問題　問2を解け。 SLSQP========== [ ] [ ]

第1週はここまで

確率・統計 stats 確率・統計に関するモジュール stats 確率分布の基礎共通のメソッド連続確率変数離散確率変数
データのあてはめ相関と回帰分布テスト

確率・統計 stats 正規分布クラス norm コンストラクタの引数 loc : 位置を表すパラメータ（μ : 平均） scale : 尺度を表すパラメータ（σ : 標準偏差）既定値をもち、それぞれloc = 0, scale = 1 つまり標準正規分布である

平均100,標準偏差10の正規分布の確率分布関数 statsメソッドにより統計量（平均,分散,歪度,尖度）を得る
from scipy.stats import norm print( norm(loc=100,scale=10 ).stats(moments='mvsk') ) 平均100,標準偏差10の正規分布の確率分布関数 statsメソッドにより統計量（平均,分散,歪度,尖度）を得る

確率・統計 stats 正規分布の固定化（変数に代入） n = norm(loc=100,scale=10) print( n.cdf(80) , n.pdf(80)) cdf (Cumulative density function : 累積分布関数)

確率・統計 stats 正規分布の固定化（変数に代入） n = norm(loc=100,scale=10) print( n.cdf(80), n.pdf(80) ) pdf（Probability density function : 確率密度関数）

確率・統計 stats 右図をプロットするプログラムコード from scipy.stats import norm import numpy as np n = norm(loc=100,scale=10) x = np.linspace(50,150,1000) y = n.pdf(x) plt.plot(x,y,label=r"$N(\mu=100,\sigma=10)$") plt.legend() plt.ylim((0,0.06)) plt.xlabel("x") plt.ylabel(r"$\varphi_{\mu,\sigma^2}(x)$")

確率・統計 stats 問題1：ある研究室でのコピー用紙の消費量は需要200, 標準偏差120の正規分布にしたがうことがわかった。
コピー用紙の消費量の確率分布をプロットし確認しなさいコピー用紙の需要が80枚以下になる確率を求めなさい *プロットしたグラフをみて需要がどのような分布になっているか考えて答えなさい

確率・統計 stats ガンマ分布連続確率分布の一種で、2つの正のパラメータにより定義される。
形状パラメータ a：分布によって異なる。a=1のとき定義される分布は指数分布となる。尺度パラメータ scale

確率・統計 stats 確率変数オブジェクト（正規分布norm等）がもつメソッド rvs : 確率変数にしたがう擬似乱数を生成する - size : 乱数の数や配列の型を指定する n = norm(loc=100,scale=10) print('array=', n.rvs(size=5) ) print('matrix=', n.rvs(size=(2,3)) ) [ ]

確率・統計 stats 確率変数オブジェクト（正規分布norm等）がもつメソッド rvs : 確率変数にしたがう擬似乱数を生成する - size : 乱数の数や配列の型を指定する n = norm(loc=100,scale=10) print('array=', n.rvs(size=5) ) print('matrix=', n.rvs(size=(2,3) ) ) [[ ] [ ]]

右歪Gumbel分布：右側の裾野が長い確率分布確率変数の最大値が漸近的に従う分布
確率・統計 stats 確率変数オブジェクト（正規分布norm等）がもつメソッド stats : 平均、分散、歪度、尖度を返す。それぞれの頭文字 mvsk を引数にすることで返り値を決定する。 g = gumbel_r(loc=0,scale=1) print( g.stats(moments='mvsk') ) x = np.linspace(-3, 5, 100) y = g.pdf(x) plot(x,y); None 右歪Gumbel分布：右側の裾野が長い確率分布確率変数の最大値が漸近的に従う分布

確率・統計 stats 期待値：確率を乗じた平均分散：分布のばらつきを表す尺度標準偏差：分散の平方根
歪度：分布の非対称性を表す尺度 - 歪度が正の分布は右側の裾野が長く、負の分布は左側の裾野が長くなる尖度：分布の尖りを表す尺度 - 尖度が正の分布は正規分布に比べて山の山頂付近で尖って、裾野が長く、　　　　負の分布は頂上付近が丸く裾野が短い形状をもつ

平均100、標準偏差10の正規分布にしたがう需要をもつ商品に対しての品切れ率を 5％にするための在庫量
確率・統計 stats 確率変数オブジェクト（正規分布norm等）がもつメソッド ppf : パーセント点関数（確率分布関数の逆関数） print( norm.ppf (0.95, loc=100, scale=10) ) 平均100、標準偏差10の正規分布にしたがう需要をもつ商品に対しての品切れ率を 5％にするための在庫量

確率・統計 stats 確率変数オブジェクト（正規分布norm等）がもつメソッド sf : 生存関数（） print( norm.sf (123, loc=100, scale=10) ) 平均100、標準偏差10の正規分布にしたがう需要をもつ商品に対して、123個仕入れた時の品切れ確率を求める 1 - norm.cdf(123,loc=100,scale=10)と同値

確率・統計 stats 問題2：ある人気ラーメン屋では平日の売り上げは平均150、標準偏差30の売り上げがあり
ある人気ラーメン屋では平日の売り上げは平均150、標準偏差30の売り上げがあり休日の売り上げは平均200、標準偏差20の売り上げがある。平日の品切れ率を5%にするためには何杯分のスープの在庫を仕込んでおくべきか。休日の品切れ率を3%にするためには何杯分のスープの在庫を仕込んでおくべきか。

120個以上の需要xが発生したとき、x-120個分の品切れ費用がかかる
確率・統計 stats 確率変数オブジェクト（正規分布norm等）がもつメソッド平均100、標準偏差10の正規分布にしたがう需要をもつ商品に対して120個仕入れたとき、品切れ費用が1個当り100円、在庫費用が1個当り10円としたときの期待費用を求める def f(x): if x>120: return 100*(x-120) elif x<120: return 10*(120-x) print( norm.expect(f, loc=100, scale=10) ) 120個以上の需要xが発生したとき、x-120個分の品切れ費用がかかる

120個以下の需要xが発生したとき、120-x個分の在庫費用がかかる
確率・統計 stats 確率変数オブジェクト（正規分布norm等）がもつメソッド平均100、標準偏差10の正規分布にしたがう需要をもつ商品に対して120個仕入れたとき、品切れ費用が1個当り100円、在庫費用が1個当り10円としたときの期待費用を求める def f(x): if x>120: return 100*(x-120) elif x<120: return 10*(120-x) print( norm.expect(f, loc=100, scale=10) ) 120個以下の需要xが発生したとき、120-x個分の在庫費用がかかる

確率・統計 stats 確率変数オブジェクト（正規分布norm等）がもつメソッド expect : 引数として与えられた関数funcの分布に対する期待値を求める。 - func : 関数 lb : 下限 ub : 上限 def f(x): if x>120: return 100*(x-120) elif x<120: return 10*(120-x) print( norm.expect(f, loc=100, scale=10) )

確率・統計 stats 問題3（発展問題）：ある人気ラーメン屋では平日の売り上げは平均150杯、標準偏差30の売り上げがあり
ある人気ラーメン屋では平日の売り上げは平均150杯、標準偏差30の売り上げがあり休日の売り上げは平均200杯、標準偏差20の売り上げがある。また、ラーメンは1杯730円スープの在庫は器材の関係により１５０杯分しか持つことができない在庫を超える売り上げ数が見込まれたときは機会損失として考え、そのときの機会損失額は１杯あたり1000円とする。このラーメン屋の平日・休日の機会損失額を含めた売り上げ高の期待値を求めよ

確率・統計 stats SciPyでは正規分布クラスnorm以外にも様々な確率分布の確率変数オブジェクトを使うことができるが、本スライドでは省略する。

確率・統計 stats 3次元プロットについてはNumPyを参考に
多変量正規分布クラス multivariate_normal ax = Axes3D(figure()) s = .1 X = np.arange(-3, 3.+s, s) Y = np.arange(-3, 3.+s, s) X, Y = np.meshgrid(X, Y) pos = np.dstack((X, Y)) n = multivariate_normal([0.0, 0.0], [[1.0, -0.8], [-0.8, 1.0]]) n = multivariate_normal([0.0, 0.0]) Z =n.pdf(pos) ax.plot_surface(X, Y, Z, rstride=1, cstride=1, norm=LogNorm(), cmap=cm.jet, linewidth=0.2); None 3次元プロットについてはNumPyを参考に

平均100、標準偏差10の正規分布にしたがう擬似乱数を10個生成
確率・統計 stats 最尤推定：最尤推定とは与えられたデータから確率分布のパラメータを推定する方法である。 rvs = norm(loc=100,scale=10).rvs(size=10) print( norm.fit(rvs) ) 平均100、標準偏差10の正規分布にしたがう擬似乱数を10個生成

確率・統計 stats 最尤推定：最尤推定とは与えられたデータから確率分布のパラメータを推定する方法である。 rvs = norm(loc=100,scale=10).rvs(size=10) print( norm.fit(rvs) ) >> ( , ) 与えられたデータの標本数を増やすと推定されたパラメータがどのように変化するか確認してみよう（推定された平均,推定された標準偏差）

返り値のタプルは（標準偏差,平均,決定係数）
確率・統計 stats probplot : データの分布を正規分布と比較する正規確率プロットを作成する。データが正規分布にしたがっているかどうかを判断する基準線や決定係数（相関係数）がプロットされる rvs = norm(loc=100,scale=10).rvs(size=10000) xy_pair, corr = probplot(rvs, plot=plt) print( corr ) 返り値のタプルは（標準偏差,平均,決定係数）

補間 interpolate 補間（interpolation）とは、特定の領域内に与えられた離散的なデータ点をもとに、同じ領域内の他の点を近似する連続関数を構築するための方法である。補間は内挿ともよばれ、与えられた領域外の点の近似を行うことを外挿・補外とも呼ぶ。

補間 interpolate x = np.arange(-4,5) y = np.sin(x)/(1+x**2) plot(x, y, 'o'); None

補間 interpolate lagrange : ラグランジュ多項式による補間（すべての点を通る多項式を一つ決定する） f = interpolate.lagrange(x, y) print(f) xnew = np.arange(-4,4, 0.01) ynew = f(xnew) plot(x, y, 'o', xnew, ynew, '-') ; None

補間 interpolate interpld : 1次元データに対する補間。引数kindで補間の種類を指定する f = interpolate.interpld(x, y, kind= 'cubic') xnew = np.arange(-4,4, 0.01) ynew = f(xnew) plot(x, y, 'o', xnew, ynew, '-'); None

補間 interpolate 補間の種類線形補間：区分ごとに異なる線分でつないだ区分的線形関数引数kindはlinear

補間 interpolate 補間の種類最近点補間：最も近いデータ点の値をとる関数引数kindはnearest

補間 interpolate 補間の種類 0次補間：データ　　　　　　　　　の値をとる関数引数kindはzero

補間 interpolate 補間の種類スプライン線形補間：与えられた複数の点を通る滑らかな曲線引数kindはslinear

補間 interpolate 補間の種類スプライン2次補間：与えられた複数の点を通る滑らかな曲線引数kindはquadratic

補間 interpolate 補間の種類スプライン3次補間：与えられた複数の点を通る滑らかな曲線引数kindはcubic

補間 interpolate 例題：あなたはテーマパークからアトラクションの待ち時間の長さを依頼された。待ち時間を30分おきに測定した結果は開園時刻を0としたPythonのリストとして、与えられている。開園から閉園までの任意の時刻における待ち時間を推定するにはどのようにしたら良いだろうか。 *待ち時間は最後尾に並んでいる人がアトラクションの会場に入場するまでの時間と定義する

補間 interpolate y = np.array([80,90,90,100,110,110,90,90,90,90,90,80, 80,60,60,60,60,70,70,70,60,35,40,50,45]) x=np.arange(0,len(y)) f = interpolate.interpld(x, y, kind= 'cubic') xnew = np.linspace(0,len(y)-1,100) ynew = f(xnew) plot(x, y, 'o', xnew, ynew, '-', lw=1,ms=7); None データの入力

補間 interpolate 問題4（教科書129p問題12）：ある新製品の毎日の需要量を調べたところ（教科書内の）表のようになっていることがわかった。ただし表内の – は需要を調べるのを忘れたことを表す。適当な補間を用いて、情報のない日の需要量を予測せよ

補間 interpolate 問題4（教科書129p問題13）：あるアトラクションの待ち時間の長さを行った。待ち時間を30分おきに測定した結果は、開園時刻を0としたPythonのリストとして以下のように与えられている。開園から閉園までの任意の時刻における待ち時間をLagrange補間と3字スプライン補間を用いて推定せよ。ただし、リスト内のNaNはアトラクションが休止中であったことを表す。 *NaNをどのように扱うか考えよう

積分 integrate quad : 1重定積分を求める。引数は関数f, 積分区間[a,b] (積分における部分区間の上限limitはoptional) 返り値は積分値と誤差のタプル (total,error) = integrate.quad(f, 0,len(y)-1,limit=1000) print( total/len(y) ) 平均

積分 integrate f = lambda x: math.pi*x**2
底面の半径rが10cm、高さhが10cmの円錐の体積を求める f = lambda x: math.pi*x**2 print( integrate.quad(f, 0, 10) )

積分 integrate dblquad : 2重定積分を求める。積分範囲の下限と上限を引数に要する中心までの距離 f=lambda x,y: math.sqrt( (x-0.5)**2 +(y-0.5)**2 ) g=lambda x: 0.0 h=lambda x: 1.0 print(integrate.dblquad(f,0,1,g,h)) print((math.sqrt(2)+math.log(1+math.sqrt(2)))/6.0) 数値でなく関数で与えなければいけないことに注意

理論値は「はじめての確率論」（近代科学社）を参考に
積分 integrate dblquad : 2重定積分を求める。積分範囲の下限と上限を引数に要する中心までの距離 f=lambda x,y: math.sqrt( (x-0.5)**2 +(y-0.5)**2 ) g=lambda x: 0.0 h=lambda x: 1.0 print(integrate.dblquad(f,0,1,g,h)) print((math.sqrt(2)+math.log(1+math.sqrt(2)))/6.0) 理論値は「はじめての確率論」（近代科学社）を参考に

積分 integrate 問題5：楕円の面積は以下の式で求められる楕円の面積を求めよ

積分 integrate 問題6 東京海洋大学編入学試験より

積分 integrate 問題（発展問題）：面積1の円状の都市に一様に住んでいる人たちが、円の中心にあるスーパーに行く時の距離の期待値を求めよ。ちなみに理論値はである

線形代数　linalg 逆行列：A をn 次正方行列とするとA の逆行列は、 AB = BA = I を満たすn次正方行列Bである A = np.array([[1,-1,-1],[-1,1,-1],[-1,-1,1]]) print(linalg.inv(A)) print( np.dot(A,linalg.inv(A) )) 行列と逆行列のドット積（内積）は単位行列

LinAlgError : singular matrix
正則行列ではない行列の逆行列を求めようとすると... B = np.array([[2,-1,-1],[-1,2,-1],[-1,-1,2]]) print(linalg.inv(B)) print(np.dot(B,linalg.inv(B))) LinAlgError : singular matrix

線形代数　linalg 問題7 a = 3 のとき以下の問いに答えよ。 H26 東京海洋大学個別学力検査より

線形代数　linalg 線形方程式を解く線形方程式を行列とベクトルを用いて表現し、linalg.solveで解く A = np.array([[1,3,-2],[2,2,-1],[3,-1,1]]) b = np.array([-2,1,5]) print(linalg.solve(A,b))

線形代数　linalg 問題8 次の連立方程式を解きなさい。

線形代数　linalg 行列式（determinant）：正方行列Aの行列式 det（A）を求める *行列式=0となる行列の実行例 A = np.array([[1,2,3],[4,5,6],[7,8,9]]) b = np.array([-2,1,5]) print(linalg.inv(A)) # エラー print(linalg.solve(A,b)) # エラー print(linalg.det(A))

線形代数　linalg 問題9 東京海洋大学編入学試験より

線形代数　linalg ノルム：平面や空間上のベクトルの長さのこと。linalg.norm関数によって様々なノルムを求めることができる引数を変更した場合の、実行結果は教科書p137を参考に

線形代数 linalg 固有値と固有ベクトルを求める関数 linalg.eig : 固有値と固有ベクトルを求める
linalg.eigvals : 固有値のみを求める A = np.array([[1,1,1],[1,2,3],[1,4,9]]) (v,X) = linalg.eig(A) print(v) print(X) V = np.diag(v) B = np.dot(X,np.dot(V,linalg.inv(X))) print(B) v : 固有値 X : 固有ベクトル

線形代数　linalg 問題10 東京海洋大学編入学試験より

Python言語によるビジネスアナリティクス実務家のための最適化・統計解析・機械学習科学技術計算モジュール SciPy

Similar presentations

Presentation on theme: "Python言語によるビジネスアナリティクス実務家のための最適化・統計解析・機械学習科学技術計算モジュール SciPy"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

Python言語による ビジネスアナリティクス 実務家のための最適化・統計解析・機械学習 科学技術計算モジュール SciPy

Similar presentations

Presentation on theme: "Python言語による ビジネスアナリティクス 実務家のための最適化・統計解析・機械学習 科学技術計算モジュール SciPy"— Presentation transcript:

Similar presentations

About project

フィードバック

Python言語によるビジネスアナリティクス実務家のための最適化・統計解析・機械学習科学技術計算モジュール SciPy

Presentation on theme: "Python言語によるビジネスアナリティクス実務家のための最適化・統計解析・機械学習科学技術計算モジュール SciPy"— Presentation transcript: