トピック
これは、千葉大学病院の ICU に 2010 年 11 月から 2019 年 3 月まで連続して入院した患者の電子カルテ データを使用したレトロスペクティブ コホート研究でした。 1,832まで 臨床転帰に関する欠測データ。
本研究は、千葉大学大学院医学研究科倫理審査委員会(承認番号:3380)の承認を受け、ヘルシンキ宣言に従って実施された。 審査委員会は、日本におけるヒトを対象とする医学および健康研究の倫理ガイドラインに従って、書面によるインフォームド コンセントの要件を放棄しました。
データの収集と定義
予測アルゴリズムを開発するために、91 個の入力変数 (補足表 S11) のデータが、ICU データ システムからの ICU 入院後 24 時間以内に収集されました。 これらの変数には、(1) 基本的な患者の特徴 (年齢、性別、身長、体重、血液型、臨床サービスのカテゴリ、入院診断、入院経路) が含まれます。 [from emergency room, general ward, operating room, other hospitals] および併存症 APACHE II [acquired immunodeficiency syndrome, acute myeloid leukemia/multiple myeloma, heart failure, lymphoma, respiratory failure, cancer metastasis, liver failure/cirrhosis, immunosuppressed status, and dialysis]); (2) 血液検査 (全血球計算、生化学、凝固および血液ガス分析); (3) 生理学的測定 (HR、血圧、呼吸数、末梢酸素飽和度) [SpO2]、および体温)。 入力率が 50% 未満の数値データは予測に使用されませんでした。
変数の重要性は、機械学習によって計算された指標として定義され、モデルが変数をどの程度うまく使用して正確な予測を行ったかを示します。 重要度の高い 3 つの主な変数は、この研究の重要な変数として定義されました。 集中治療室での滞在期間は生存者間で分析され、短期 (1 週間未満)、中 (1 ~ 2 週間未満)、長期 (2 週間以上) の 3 つのカテゴリに分類されました。 短期および長期の ICU 滞在は、これらのサブカテゴリーが ICU の死亡率と重症度に関連していると報告されているため、臨床的に重要であると考えられていました。16.19. さらに、ICU に長期滞在するリスクのある患者を特定することで、適切な ICU 管理に貢献し、ICU のベッド不足を回避できます。16.
欠損値の代入
を使用して、単一のデータセットで数値データの欠損値に対して複数の代入 (10 回) を実行しました。 sklearn.impute.反復代入 Python (scikit-learn 0.22.1; https://scikit-learn.org)。 カテゴリ変数をバイナリ変数に変換するために、ダミーコーディングが使用されました。 欠損値の代入後、データセットは、それぞれデータセットの 80% と 20% を構成するトレーニング コホートとテスト コホートの間でランダムに分割され、2 つのコホート間で変数が比較されました。
統計分析
一次結果変数は ICU 死亡率で、二次結果変数は ICU 滞在期間でした。 結果の予測は、RF、XGBoost、およびニューラル ネットワークの 3 種類の分類器で計算された機械学習アプローチ アルゴリズムを使用するか、SOFA スコアである APACHE II スコアを使用してロジスティック回帰分析を使用して行われました。 RF は標準的なアンサンブル機械学習手法であり、XG Boost は RF と同じ決定木ベースの手法であり、複雑なデータに対する精度の高さから近年頻繁に使用されています。 これら 2 つの分類子とは異なり、ニューラル ネットワークは非決定木ベースの方法です。 すべての機械学習手法を評価することは困難であるため、本研究では代表的で特徴の異なるこれら 3 つの分類器を選択しました。 トレーニング コホートを使用して機械学習アルゴリズムが導出されると、確立されたアルゴリズムがテスト コホートに適用されました。 死亡率を予測するために RF が他の 2 つの機械学習モデルよりも優れていることがわかったので、変数の重要性と RF モデルの主要な変数を確認しました。 予測における変数の重要性を評価するために、Python パッケージ scikit-learn の機能重要度関数を使用しました。
死亡率の危険因子が高い ICU 患者の堅牢なクラスタリングのために、患者間の類似性を評価するために RF 非類似性尺度が計算されました。 RF 非類似度測定は、トレーニングされた RF モデルに基づいてサンプル間の類似性を評価する方法です。サンプルの類似性は、2 つのサンプルがモデルの決定木 RF の同じリーフにランク付けされる頻度によって評価されます。20. 2 つのサンプルがすべての決定木で同じリーフに分類される場合、2 つのサンプル間の RF 非類似度は 0 (完全に同一) です。 逆に、2 つのサンプルが同じシートに分類されない場合、RF 非類似度は 1 (完全に異なる) です。 同じシートに分類される頻度が高いほど、RF 非類似度は 0 に近づきます。次に、RF 非類似度を UMAP の入力として使用して、テスト コホートの患者の 2D 表現を提供しました。 UMAPは、サンプル間の距離(非類似度)を維持しながら、サンプルを2次元空間に配置できる多重学習の一種です。21. その後、ICU 患者のクラスタリングは、2 つの UMAP スケール座標で各変数の分布を視覚的に識別することによって得られました。 この研究で実行した RF 非類似度測定に基づくクラスタリングは、教師あり機械学習モデルの視覚化です。 教師あり学習では、予測の結果は確率ですが、「予測が間違っている可能性が高いサンプルはどれか」「予測確率が似ていても特徴が異なるサンプルはどれか」など、予測の詳細は明示的に表示されません。 RF の非類似性に基づく視覚化とクラスタリングにより、母集団の不均一性と予測が困難なサンプルを明らかにすることができます。
ICU 滞在期間を予測するために、APACHE II または SOFA スコアを使用して、RF アルゴリズムを使用した機械学習とロジスティック回帰分析を使用して、短期 (短期 vs 非短期) および長期 (長期 vs 非長期) のカテゴリを評価しました。 死亡率分析と同様に、ICU 滞在期間の予測に関連する変数と主要な変数の重要性が確認されました。 また、ordinalForest を使用して ICU 滞在期間の予測値を分析しました。これは、ICU 滞在の 3 つのカテゴリすべての予測値を同時に推定することができました。 R で実装された ordinalForest を除いて、すべての分類子は Python で実装されました。
データは、連続値の中央値 (四分位範囲) として、カテゴリ値の絶対数とパーセンテージとして表されます。 予測値を評価するために AUC を計算しました。 統計的有意性は P < 0.05 に設定されました。 機械学習のモデルを構築するために、Python パッケージ (sklearn.neural_network.MLPClassifier、sklearn.ensemble.RandomForestClassifier、xgboost、sklearn.linear_model.LogisticRegression) および R パッケージ (ordinalForest 2.4.1) を使用して分析を実行しました。
倫理的な承認と参加への同意
この研究は、千葉大学大学院医学研究科研究倫理委員会(承認番号:3380)によって承認され、データの収集が遡及的であったため、研究に対する書面による同意の放棄を発行しました。
「邪悪なポップカルチャーの擁護者。トラブルメーカー。不治のソーシャルメディアの魔術師。完全なインターネット愛好家。アマチュアのツイッター愛好家。流行に敏感な探検家。」