2022/04/15 質疑応答 (倉澤) 車を持ちたくない人が駅の近くに住んでいる、という解釈でいいのか 車を持ちたくない、という特性の人が駅に住んでいるということ? (回答) そうです (倉澤) 他の地域でも使える? (回答) 今回の分析結果そのものは他地域にそのまま適用できないが、他の地域の状況を分析する時にこういった分析が役に立つのではないか。 他の結果を包含して役立てることもできる。 ただし結果自体は熊本のもの。 (倉澤) 環境と個人の好みを分離するということか (回答) 青とオレンジ(注:スライドp34参照)の差分がその分離の分 (倉澤) 他の地域に応用していけたら面白いなと (回答) 操作変数の方が近いのでは? Zを知ることができれば、他の地域にも応用できる、ということですよね サンプルセレクションはZを知るのを諦めて、分けてしまうもの。なので、話としては操作変数のほうに近い (林) 居住地選択以外でも適用できるのか (回答) できる。アクティビティモデルへの適用などは最近よく行われている。 複数場所の活動場所の選択と活動内容の間に生じる内生性の問題など。 他には車種選択も。 種類と台数の間に生じる選択などの一般的な内容にも適用できる。 (金田) 観測できる事実と観測できない事実を比較するのは差の差分析や不連続回帰などがあると認識しているが、それを使わない理由を教えて欲しい (回答) 内生性を補正できないから、つまりσをそういった分析では推定できないから。因果推論手法にもできる範囲とできない範囲がある。DIDは上の(注:スライドp10参照)内生性バイアスの原因を観測する手法に含まれるのでは。 (奥田) 新しい手法におけるパラメーターの推定に関わる時間は既存の手法と比べてどうか (回答) 今回の実証分析の時間を説明する。サンプルは2530 他手法であれば一瞬だが、一回の推定に5日かかった すでに早いアルゴリズムでこれ以上は早くならない プログラミングをRですべてやったのがボトルネック C++でやれば早くできたのでは (奥田) 結果②の(注:スライドp34参照)熊本で実際に適用した場合について。 「移転を促進したとしても、自動車保有確率の減少には寄与しないという可能性がある」ということだが、今回の手法にはそれがわかることが大事なのであって、居住地の促進にあたってどれくらいのインセンティブが必要か、というにはこの手法でないほうが適している、という認識であっているか (回答) その通り。今回分かったことは赤枠がすべて、インセンティブに関しては操作変数の方が適している。操作変数では構造を分けることなく、説明変数にインセンティブの項を加えてやることもできる。そちらが主目的なら操作変数を使うのがよい。 (白井) 事前分布の妥当性の検証の部分が理解できなかった。今回の熊本のデータだと何をどうしたのか。 (回答) 分散は0.1と0.2を試している。σが狭い時と大きい時をチェック。その妥当性の検証はWAICを見て、最小の時は予測制度が最大の時、分散が0.1だと最大なので、その妥当性をチェックしていた。0.2の場合は、過学習している。このことで妥当性を検証 (羽藤) そもそも妥当性の差がすくないよね (回答) そこが課題です。 (羽藤) シグマの期待値を変えたらどうなる、平均0じゃなくすなら (回答) 推奨されている方法としては、モデル平均化を行う。一つとしては、仮定を全部を書いて結果を見せるのも方法。それでなくて平均するのもベイズの教科書に乗っている。取り組んでいる途中。 (羽藤) 計算時間ながいよね (回答) 丁寧にやりすぎているのかも。 (増橋) 卒論の積み残しを悔しながら聞いていた。卒論では再開発に伴う土地利用変化の歩行者の経路選択行動に対する影響を、相関ではなく因果効果として分離する研究を、渡邊さんのサンプリンに似た手法を用いて行った。 サンプリングの際に、経路が再開発したエリアを基準としていたが、分析者が勝手に決めた指標で決めうちでサンプリングすると、サンプルが含む個人属性が結局異なる。その考慮はどうしているのか。個人属性が異なると、それに伴う潜在変数(心理・認知など...)が異なってしまうと思う。 また、奥田の質問のような、エビデンスとして因果効果を数値として出したい場合には個人属性をモデルに入れ込むことを発展として考えているのか。 (+バイナリで5日かかるということだが、歩行者の回遊行動のモデル化のように逐次選択モデルとする場合、計算することは現実的に可能なんだろうか...) 修正済 4/15 14:22 マスハシ (回答) 個人属性はどこでコントロールするかに関して。 xに個人属性を含める。そこでコントロールした上でYとYを比較して差分をとる。ここのコントロールが大切。データのパラメーターにバイアスがかかってしまうので、σを補正することで個人属性のコントロールをしっかりしようとする。 (増橋) σを調整してあげることで、誤差の分布にいれてあげるということ? (回答) 一括で推定した。モデルで (増橋) 経路選択モデルだとすごい計算量になるが、この交通行動はバイナリー。ということは経路選択とかで逐次的にやると計算可能な未来は見えているのか (回答) 多項化は簡単にできる。 (加藤) DIDやマッチングの効果の推定と、内生性が生じてしまうことで因果関係が見たかったので操作変数がみたかったが、適切な操作変数を見つからなかった。医療とかならあるかもしれないけど交通…いろいろ試してみても操作変数が思いつかない (羽藤) 医療なら何がある? (加藤) 喫煙率と流産率 医療と全く関係ないないかを使えば適切 交通なら全部関連してそうで無理。 質問としては、誘導しても自動車の保有率は上昇しない?郊外に住まないと決め切っている人も内生性が存在するのか。先程の結果は過小評価になってはいないか。 (回答) まず操作変数の見つけ方について。 交通分野では大きく2つ 居住密度と交通行動。よりマクロなデータを操作変数として使う。2つ目は実証実験で操作変数を作ってしまう。サービスを設計することで作ってしまう。 次に、郊外に決め切っている人がいた場合について。 実は、居住地選択モデルの説明変数で、居住地に対する選択はPTで聞いている。「今住んでいるところを決めた時になぜ決めたか」それでコントロールはしている。めちゃくちゃ効いているかはわからないが細かいことをしりたいなら、主観的なものとしてモデルに含む必要がある。 (加藤) いろいろな地域で同じような推定をし、地域ごとにもとの推定とどう異なるかみたら面白そうだな、と思った。 (福谷)結局、都市部に住むから車を持たないのではなくて、車を持ちたくないから都市部に住むということ。なんでそういうことがわかったのか。 (回答) 主観的な選好、という話は公聴会でも伝わりづらかった 年収を欠落させた話をするとわかりやすい。自動車を持つかどうかは年収と相関。xに年収をいれたらYは増えるはず、居住地選択に関してもプラスに働く。年収が誤差項に入った場合、プラスに操作し正の相関がある。それと同じ考えで、交通モデルにー+に作用する どういった変数が欠落して、どっち方向に作用するか。の話。 ZOOM CHAT 17号の質問、結構聞こえづらいかもしれないです…汗 EIJI HATO から 皆様 (13:43) (事前分布に対して,さらに事前分布を仮定することで(ベイズのベイズのようなイメージ),複雑なサンプルセレクション問題を構造化したMXLモデルに拡張できるように思いました) EIJI HATO から 皆様 (13:51) (内生性を直接推定しようとすると,構造推定が思い浮かびますが,モデルとして式で書いて,多様体をつかって推定するような方法もありえるかもですね) EIJI HATO から 皆様 (13:59) (と考えていくと,やっぱり多様体が収束性能を考えると,強いのではないかという気もしますね) EIJI HATO から 皆様 (14:11) (居住と車保有は,ウラボロス状態だから,再帰構造の推定ができた方がいいのはいいよね) Ryo Kato から 皆様 (14:12) さきほどの、医療分野での操作変数の例は、喫煙と流産の因果関係に対して、母親の遺伝子型を用いる、みたいな感じでした