(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】2018536914
(43)【公表日】20181213
(54)【発明の名称】遺伝医学検査のためのシステムおよび方法
(51)【国際特許分類】
   G06F 19/22 20110101AFI20181116BHJP
   C12M 1/00 20060101ALI20181116BHJP
【FI】
   !G06F19/22
   !C12M1/00 Z
【審査請求】未請求
【予備審査請求】未請求
【全頁数】29
(21)【出願番号】2018513826
(86)(22)【出願日】20160915
(85)【翻訳文提出日】20180419
(86)【国際出願番号】US2016051928
(87)【国際公開番号】WO2017048945
(87)【国際公開日】20170323
(31)【優先権主張番号】62/219,408
(32)【優先日】20150916
(33)【優先権主張国】US
(81)【指定国】 AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,ST,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,KM,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IR,IS,JP,KE,KG,KN,KP,KR,KW,KZ,LA,LC,LK,LR,LS,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SA,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT,TZ,UA,UG
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.UNIX
(71)【出願人】
【識別番号】513156548
【氏名又は名称】グッド スタート ジェネティクス, インコーポレイテッド
【住所又は居所】アメリカ合衆国 マサチューセッツ 02139, ケンブリッジ, パトナム アベニュー 237
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】アダムス, マーク
【住所又は居所】アメリカ合衆国 マサチューセッツ 02139, ケンブリッジ, パトナム アベニュー 237
【テーマコード(参考)】
4B029
【Fターム(参考)】
4B029AA07
4B029AA27
4B029FA15
(57)【要約】
患者の以前の遺伝子検査の結果に対して重要であり意義のある新しい医療情報の通知を提供する遺伝子分析システム。システムは、外部データベースから臨床情報を検索し、また、そのデータベースに対するその後の更新が患者にとって重要であるか否かを評価する。重要である場合、システムは、新しい臨床情報が利用可能であるという通知を提供する。本発明の方法は、患者の配列データを得るステップ;配列データ中のバリアントに関する臨床情報をデータベースから検索するステップ;および臨床情報をメモリサブシステムにあるバリアントと関連させるステップを含む。本方法は、臨床情報に対する更新が公開されているか否かを決定するステップ;更新の重要性を評価するステップ;重要である場合、更新臨床情報をユーザに通知するステップをさらに含む。
【特許請求の範囲】
【請求項1】
ゲノム情報の有益な内容を更新するための方法であって、
患者に由来する試料から配列データを得るステップ、
前記配列データを、有形メモリサブシステムと接続されているプロセッサを有するコンピュータシステムに入力するステップ、
前記配列データ中の少なくとも1つのバリアントに関する臨床情報をデータベースから検索するステップ、
前記臨床情報を前記メモリサブシステムにある前記バリアントと関連させるステップ、
前記臨床情報に対する更新が公開されているか否かを決定するステップ、
前記更新が重要性の所定の判定基準を満たすか否かを評価するステップ、および
前記重要性の所定の判定基準を満たす更新された臨床情報をユーザに通知するステップ
を含む方法。
【請求項2】
前記データベースが、遠隔コンピュータシステム上の精選されたデータベースである、請求項2に記載の方法。
【請求項3】
前記評価するステップが、前記データベースに入力されるメタデータを読み取ることを含む、請求項2に記載の方法。
【請求項4】
前記メタデータは、前記更新の出所、前記更新の日付、および前記所定の判定基準の少なくとも1つを識別する、請求項3に記載の方法。
【請求項5】
前記配列データを得るステップが、前記試料に由来する核酸を配列決定して、複数の配列リードを得ることを含む、請求項3に記載の方法。
【請求項6】
前記バリアントに関する前記情報を検索するステップの前に、前記少なくとも1つのバリアントを識別するために前記配列リードを参照ゲノムにマッピングするステップ、および前記少なくとも1つのバリアントを、バリアントコールとして前記メモリサブシステムに保存するステップをさらに含む、請求項5に記載の方法。
【請求項7】
前記患者の身元、前記バリアントコール、および前記バリアントに関する前記臨床情報を含む報告書をユーザに提供するステップ;および
その後、前記更新された臨床情報を有する更新された報告書を提供するステップをさらに含む、請求項6に記載の方法。
【請求項8】
前記メモリサブシステムにある前記バリアントと関連する前記臨床情報が、機能情報、疾患関連性、および医療情報の1つまたは複数を含む、請求項7に記載の方法。
【請求項9】
前記更新が公開されているか否かを決定するステップの前に、報告書をユーザに提供するステップをさらに含み、前記報告書が、前記バリアントと関連する前記臨床情報および前記患者の身元を含む、請求項1に記載の方法。
【請求項10】
前記決定するステップ、前記評価するステップ、および前記通知するステップが、少なくとも1週間にわたって複数の異なる更新について複数回実施される、請求項9に記載の方法。
【請求項11】
前記臨床情報が、前記配列データ中のバリアントと、医学的状態、予後、治療レジメン、または疾患罹患傾向との関連性を含む、請求項10に記載の方法。
【請求項12】
前記コンピュータシステムの少なくとも一部分が、前記方法の実行を妨害せずに前記プロセッサの代わりに別のプロセッサを使用することができるクラウド型システムにより提供される、請求項11に記載の方法。
【請求項13】
前記更新された臨床情報を前記ユーザに通知するステップが、前記コンピュータシステムからユーザコンピュータデバイスにアラートを送信することを含む、請求項10に記載の方法。
【請求項14】
前記更新された臨床情報を前記ユーザに通知するステップが、ユーザコンピュータデバイスのモバイルまたはウェブインタフェースにアラートを表示させることを含む、請求項10に記載の方法。
【請求項15】
前記配列データを得るステップが、前記試料に由来する核酸を配列決定して、複数の配列リードを得ることを含み、前記方法が、
前記配列リードを参照ゲノムにマッピングして、前記少なくとも1つのバリアントを識別するステップ、
前記バリアントに関する前記情報を検索する前に、前記少なくとも1つのバリアントをバリアントコールとして前記メモリサブシステムに保存するステップ、
前記患者の身元、前記バリアントコール、および前記バリアントに関する前記臨床情報を含む報告書をユーザに提供するステップ;および
その後、前記更新された臨床情報を有する更新された報告書を提供するステップ
をさらに含む、請求項14に記載の方法。
【請求項16】
ゲノム情報の有益な内容を更新するためのシステムであって、命令を保存する有形メモリサブシステムと接続されているプロセッサを含み、前記プロセッサにより実行されると、前記命令は前記システムに、
患者に由来する試料から配列データを得るステップ、
前記配列データ中の少なくとも1つのバリアントに関する臨床情報をデータベースから検索するステップ、
前記臨床情報を前記メモリサブシステムにある前記バリアントと関連させるステップ、
前記臨床情報に対する更新が公開されているか否かを決定するステップ、
前記更新が重要性の所定の判定基準を満たすか否かを評価するステップ、および
前記重要性の所定の判定基準を満たす更新された臨床情報をユーザに通知するステップ
を実行させる、システム。
【請求項17】
前記データベースが、遠隔コンピュータシステム上の精選されたデータベースである、請求項16に記載のシステム。
【請求項18】
前記評価するステップが、前記データベースに入力されるメタデータを読み取ることを含む、請求項17に記載のシステム。
【請求項19】
前記メタデータは、前記更新の出所、前記更新の日付、および前記所定の判定基準の少なくとも1つを識別する、請求項18に記載のシステム。
【請求項20】
前記バリアントに関する前記情報を検索するステップの前に、前記配列データを参照ゲノムにマッピングして、前記少なくとも1つのバリアントを識別し、そして前記少なくとも1つのバリアントをバリアントコールとして前記メモリサブシステムに保存するようにさらに作動可能である、請求項15に記載のシステム。
【請求項21】
前記患者の身元、前記バリアントコール、および前記バリアントに関する前記臨床情報を含む報告書をユーザに提供するように、および
その後、前記更新された臨床情報を有する更新された報告書を提供するようにさらに作動可能である、請求項20に記載のシステム。
【請求項22】
前記メモリサブシステムにある前記バリアントと関連する前記臨床情報が、機能情報、疾患関連性、および医療情報の1つまたは複数を含む、請求項21に記載のシステム。
【請求項23】
前記更新が公開されているか否かを決定するステップの前に、報告書をユーザに提供するようにさらに作動可能であり、前記報告書が、前記バリアントと関連する前記臨床情報および前記患者の身元を含む、請求項21に記載のシステム。
【請求項24】
前記決定するステップ、前記評価するステップ、および前記通知するステップを、少なくとも1週間の期間にわたって複数の異なる更新について複数回実施する、請求項23に記載のシステム。
【請求項25】
前記臨床情報が、前記配列データ中のバリアントと、医学的状態、予後、治療レジメン、または疾患罹患傾向との関連性を含む、請求項24に記載のシステム。
【請求項26】
前記システムの少なくとも一部分が、方法の実行を妨害せずに前記プロセッサの代わりに別のプロセッサを使用することができるクラウド型システムにより提供される、請求項26に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本出願は、2015年9月16日に出願された米国仮出願番号第62/219,408号に基づく優先権および利益を主張しており、この仮出願は、その全体が参考として援用される。
【0002】
技術分野
本発明は、遺伝医学に関する。
【背景技術】
【0003】
背景
一部の乳児は、嚢胞性線維症、テイ−サックス病、または血友病等の遺伝障害をもって生まれてくる。そのような障害は、ゲノムの異常により引き起こされる問題であり、多くの場合、DNAの配列決定等の遺伝子検査法により検出することができる。人の遺伝子およびそのあらゆる異常を研究することにより、遺伝子障害およびその症状を管理および処置するための重要なツールが医師に提供される。残念ながら、遺伝子障害を有する患者に有効な処置を提供することは、患者のゲノムを配列決定し、結果を検討すればよいというほど単純だとは必ずしも限らない。
【0004】
ヒト遺伝学は、進歩し続けている技術分野である。研究者らが進歩すると共に、新しい突然変異が発見され、突然変異間の新しい関係性が発見され、突然変異と疾患との新しい関連が確立される。配列決定により遺伝子をスクリーニングした患者には、遺伝子情報を示す報告書を提供することができる。報告書には、一部のバリアントは、ある状態と関連するとして列挙される場合もあり、または重要性が未知のバリアントとして表記される場合もある。しかしながら、患者は、研究者らがいつ新しい情報を収集したかを知るよしもない。遺伝子検査後に患者がさらなる情報を求めようとしても、莫大な量の新しい情報(再分類、受託番号の更新、新しい疾患情報、重要性の低い臨床試験報告書、その患者に実際的には影響を及ぼさない文献レビュー)が氾濫しており、生データの不可解で難解な文献情報が患者に押し寄せることになる。
【発明の概要】
【課題を解決するための手段】
【0005】
要旨
本発明は、患者の以前の遺伝子検査の結果に対して重要であり意義のある新しい医療情報の通知を提供する遺伝子分析システムを提供する。このシステムは、配列データを分析して突然変異を識別するために、ならびに患者の遺伝子情報および識別された突然変異に関係がある臨床情報を含む患者報告書を作成するために使用することができる。システムは、第三者の臨床判断支援リソース等の外部データベースから、臨床情報の少なくとも一部を引き出す。外部データベースが更新されると、システムは、新しい情報が、その突然変異を有するその患者にとっての重要性がある特定のレベルに上昇したか否かを評価し、該当する場合は、患者の主治医または遺伝相談員等のユーザに、新しい臨床情報を通知することができる。システムは、新しい情報、または新しい情報に基づく行動計画を含む、患者に関する新しい報告書を作成することができる。新しい情報の重要性の評価は、変化の範囲および特定の患者に対する影響を両方とも考慮に入れることができる。したがって、例えば、一部の人口統計学的集団における疾患の発症率にわずかな変化が報告された場合の一部の更新は、些細なものとみなされ無視される場合がある。加えて、更新があっても、患者に関係がない場合は通知を開始する必要はなく、例えば、あるSNPが前立腺がんに関連付けられている場合、女性患者には緊急通知をしなくともよい。
【0006】
システムは、外部データベースになされる更新の範囲および影響を評価するため、患者または患者のケア提供者は、患者に有益となるであろう更新がなされた際に通知を受け取ることになり、医学文献における遺伝子または突然変異のありとあらゆる言及について通知を受ける訳ではない。システムは、自動的にリアルタイムで外部データベースに問い合わせるように作動することができるため、患者は、新しい医療情報が精選(curated)されて、医学文献または外部データベースに含まれると直ちに、それを知ることができる。患者は、新しい医療情報を速やかに受け取るため、治療の機会が大きく向上するだけでなく、遺伝医学の新しい革新がなされるやいなや、それほど有用ではないかまたは古い理解が駆逐される。遺伝的状態を有する患者は、利用可能になった最新の臨床情報へと導かれるため、命を救うことができ、人々の生活の質を大きく向上させることができる。
【0007】
ある特定の態様では、本発明は、ゲノム情報の有益な内容を更新するための方法を提供する。上記方法は、患者に由来する試料から配列データを得るステップ;配列データをコンピュータシステムに入力するステップ;配列データ中の少なくとも1つのバリアントに関する臨床情報をデータベースから検索するステップ;および臨床情報をメモリサブシステムにあるバリアントと関連させるステップを含む。上記方法は、コンピュータシステムの使用を継続して、臨床情報に対する更新が公開されているか否かを決定するステップ;更新が重要性の所定の判定基準を満たすか否かを評価するステップ;重要性の所定の判定基準を満たす更新された臨床情報をユーザに通知するステップをさらに含む。配列データは、試料に由来する核酸を配列決定して、複数の配列リードを得ることにより取得してもよい。配列リードを参照ゲノムにマッピングして、少なくとも1つのバリアントを識別してもよく、少なくとも1つのバリアントは、そのバリアントに関する情報を検索する前に、バリアントコールとしてメモリサブシステムに保存される。
【0008】
一部の実施形態では、データベースは、遠隔コンピュータシステム上の精選されたデータベースである。評価するステップは、データベースに入力されるメタデータを読み取ることを含んでいてもよい。メタデータは、更新の出所、更新の日付、または所定の判定基準等を識別する。
【0009】
ある特定の実施形態では、上記方法は、患者の身元、バリアントコール、およびバリアントに関する臨床情報を含む報告書をユーザに提供するステップ;およびその後、更新された臨床情報を有する更新された報告書を提供するステップを含む。好ましくは、コンピュータシステムのメモリサブシステムにあるバリアントと関連する臨床情報は、機能情報、疾患関連性、および医療情報の1つまたは複数を含む。決定ステップの前にユーザに提供される報告書は、バリアントと関連する臨床情報および患者の身元を含んでいてもよい。任意選択で、決定するステップ、評価するステップ、および通知するステップは、少なくとも1週間の期間にわたって複数の異なる更新について複数回実施される。好ましくは、臨床情報は、配列データ中のバリアントと、医学的状態、予後、治療レジメン、または疾患罹患傾向との関連性の1つまたは複数を含む。コンピュータシステムの少なくとも一部分は、上記方法の実行を妨害せずにそのプロセッサの代わりに別のプロセッサを使用することができるクラウド型システムにより提供されてもよい。方法は、コンピュータシステムからユーザコンピュータデバイスにアラートを送信する(例えば、ユーザコンピュータデバイスのモバイルまたはウェブインタフェースにアラートを表示させる)ことを含む、更新された臨床情報をユーザに通知するステップを含んでいてもよい。ある特定実施形態では、配列データを得るステップは、試料に由来する核酸を配列決定して、複数の配列リードを得ることを含み、配列リードを参照ゲノムにマッピングして、少なくとも1つのバリアントを識別するステップ;バリアントに関する情報を検索する前に、少なくとも1つのバリアントをバリアントコールとしてメモリサブシステムに保存するステップ;患者の身元、バリアントコール、およびバリアントに関する臨床情報を含む報告書をユーザに提供するステップ;およびその後、更新された臨床情報を有する更新された報告書を提供するステップを含んでいてもよい。
【0010】
本発明の態様は、ゲノム情報の有益な内容を更新するためのシステムを提供する。システムは、命令を保存する有形メモリサブシステムと接続されているプロセッサを含み、プロセッサにより実行されると、その命令は、システムに、患者に由来する試料から配列データを得るステップ、配列データ中の少なくとも1つのバリアントに関する臨床情報をデータベースから検索するステップ、および臨床情報をメモリサブシステムにあるバリアントと関連させるステップを実行させる。さらに、システムは、臨床情報に対する更新が公開されているか否かを決定し、更新が重要性の所定の判定基準を満たすか否かを評価し、重要性の所定の判定基準を満たす更新された臨床情報をユーザに通知する。好ましくは、データベースは、遠隔コンピュータシステムにある精選されたデータベースである。
【0011】
評価するステップは、データベースに入力されるメタデータを読み取ることを含んでいてもよい。メタデータは、更新の出所、更新の日付、および所定の判定基準の少なくとも1つを識別してもよい。システムは、配列データを参照ゲノムにマッピングして、少なくとも1つのバリアントを識別し、バリアントに関する情報を検索する前に、少なくとも1つのバリアントをバリアントコールとしてメモリサブシステムに保存するようにさらに作動可能であってもよい。それに加えてまたはその代わりに、システムは、患者の身元、バリアントコール、およびバリアントに関する臨床データを含む報告書をユーザに提供するように、およびその後、更新された臨床情報を有する更新された報告書を提供するようにさらに作動可能である。メモリサブシステムにあるバリアントと関連する臨床情報は、機能情報、疾患関連性、および医療情報の1つまたは複数を含んでいてもよい。一部の実施形態では、システムは、更新が公開されているか否かを決定する前に、バリアントと関連する臨床情報(例えば、配列データ中のバリアントと、医学的状態、予後、治療レジメン、または疾患罹患傾向との関連性)および患者の身元を含む報告書をユーザに提供するように作動可能である。
【図面の簡単な説明】
【0012】
【図1】図1は、更新された臨床情報を提供するための方法を図解する。
【0013】
【図2】図2は、標的ゲノム物質の領域を捕捉するためのMIPの使用を例示する。
【0014】
【図3】図3は、バリアントを検出するためのワークフローのダイヤグラムを示す。
【0015】
【図4】図4は、本発明の方法を実施するためのプラットフォームアーキテクチャを例示する。
【0016】
【図5】図5は、本発明のシステムのダイヤグラムを示す。
【0017】
【図6】図6は、医療情報に関するワークフローを図解する。
【0018】
【図7】図7は、報告書が利用可能であることをユーザに通知すべきか否かの決定を示す。
【0019】
【図8】図8は、更新の重要性を決定するためのフローチャートである。
【発明を実施するための形態】
【0020】
詳細な説明
患者の以前の遺伝子検査の結果に対して重要であり意義のある新しい医療情報の通知を提供する遺伝子分析システム。このシステムは、外部データベースから臨床情報を検索し、また、そのデータベースに対するその後の更新が患者にとって重要であるか否かを評価する。重要である場合、システムは、新しい臨床情報が利用可能であるという通知を提供する。本発明の方法は、患者の配列データを得るステップ;配列データ中のバリアントに関する臨床情報をデータベースから検索するステップ;およびこの臨床情報をメモリサブシステムにあるバリアントと関連させるステップを含む。上記方法は、臨床情報に対する更新が公開されているか否かを決定するステップ;更新の重要性を評価するステップ;重要である場合、更新された臨床情報をユーザに通知するステップをさらに含む。
【0021】
図1には、更新された臨床情報を提供するための方法101が図解されている。試料収集105は、唾液試料を収集することを含んでいてもよい。試料は、患者または患者の親がウェブサイト/モバイルアプリで注文するキット等のカスタムキットを使用して収集してもよい。一部の実施形態では、親が自身からまたは子供から口腔粘膜検体を採取し、試料を臨床施設に送付する。患者に関するデータは、収集時にデスクトップアプリまたはモバイルアプリに追加することができる。本明細書に記載の試料調製法および配列決定法に従って、試料を配列決定109する。データは、処理および分析のために、ほぼリアルタイムで、分析プラットフォーム(例えば、AWS S3)にアップロードすることができる。データは、恒久的記録媒体(例えば、Amazon Glacier)に保管してもよい。バリアント検出113は、任意の好適な方法により進めてもよい。例えば、バリアント検出は、本明細書に記載の方法を含んでいてもよく、cpipeまたはGATK等のツールを使用してもよい。バリアント検出操作113では、一塩基多様性(SNV)、置換、および挿入または欠失バリアント(インデル)が、患者のエクソームまたはゲノムにわたって記述される。機能アセスメント117を実施して、突然変異の機能的重要性を査定してもよい。機能アセスメント117では、Genospace、Broad Inst、Signifikance等のツールを使用して、一連のアルゴリズム手法および発見的手法を応用することにより、バリアントの機能的影響を査定してもよい。本発明の方法は、システム中の全バリアントデータの継続したエージェントベースの更新および分析を提供する。検出アルゴリズムの精選された更新により、エージェントベースのデータベース更新が開始される。疾患関連性121では、バリアントを、疾患および任意の追加情報と関連付けてもよい。これは、手動キュレーションおよび自動キュレーションを系統的に意味的に制御して組み合わせて、あらゆる範囲の公開および私的データソースを活用することにより実施してもよい。カスタマイズされたキュレーション(curation)ワークベンチは、キュレーションプロセスを容易にする。本発明のシステムおよび方法は、医学的テキスト125を生成するように作動可能である。医学的テキストは、外部データベースとしての臨床判断支援リソース等の外部ソースに問い合わせることにより提供することができる。1つの好適な製品は、Wolters−Kluwer社によりUP2DATEという商標で提供されている臨床判断支援リソースである。本発明のシステムおよび方法では、指定の疾患に関する、外部データベースの構造化された実際の行動に役立つ医療情報に自動化されたアクセスを使用し、外部データベースからの新しい「タグ化コンテンツ」に基づき、更新のカスタム統合を提供する。外部データベースは、親および小児科医のために医学的内容をカスタマイズし、突然変異またはバリアントにより医療情報について問い合わせることができる。本発明のシステムおよび方法は、更新されたデータの個別化アクセスを提供するために、モバイルアプリおよびデスクトップウェブアプリ等のユーザインタフェース131を提供する。関連情報の精選された更新により生成されるアラートは、該当する患者、親、医師、または遺伝相談員に自動的にプッシュ送信される。
【0022】
1.試料収集&試料調製
試料収集105は、唾液試料を収集することを含んでいてもよい。試料は、カスタムキットを使用して収集してもよい。キットは、ウェブサイト/モバイルアプリから注文することができる。一部の実施形態では、親自身が試料を収集および送付する。子供および親に関するデータは、収集時にデスクトップアプリまたはモバイルアプリに追加される。それに加えてまたはその代わりに、試料は、任意の臨床的に許容される様式で得られる組織または体液から得てもよい。体液としては、粘液、血液、血漿、血清、血清誘導体、胆汁、血液、母体血液、痰、唾液、汗、羊水、月経液、乳腺液、卵巣の卵胞液、卵管液、腹水、尿、および腰椎または心室CSF等の脳脊髄液(CSF)を挙げることができる。また、試料は、穿刺吸引または生検組織であってもよい。また、試料は、細胞または生物学的物質を含有する媒体であってもよい。また、試料は、環境(例えば、空気、農産物、水、および土壌)から得てもよく、または研究試料(例えば、核酸増幅反応の産物、または精製されたゲノムDNA、RNA、タンパク質等)を含んでいてもよい。
【0023】
ゲノム核酸の単離、抽出、または誘導は、当技術分野で公知の方法により実施することができる。生物学的試料からの核酸の単離は、一般的に、試料中に存在するゲノム核酸を抽出し、分析に使用可能になるように生物学的試料を処理することを含む。一般的に、核酸は、GreenおよびSambrook、2012年、Molecular Cloning: A Laboratory Manual 第4版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、NY(2028頁)に記載のもの等の技法を使用して抽出される。この文献の内容は、参照により本明細書に組み込まれる。キットを使用して、組織および体液からDNAを抽出してもよく、ある特定のそのようなキットは、例えば、BD Biosciences Clontech(パロアルト、CA)、Epicentre Technologies(マディソン、WI)、Gentra Systems,Inc.(ミネアポリス、MN)、およびQiagen Inc.(バレンシア、CA)から商業的に利用可能である。そのようなキットには、通常、プロトコールが記載されているユーザガイドが含まれている。
【0024】
細胞を溶解して、ゲノム核酸を単離することが好ましい場合がある。細胞抽出物を、例えば、差別的な沈澱、カラムクロマトグラフィー、有機溶媒による抽出、濾過、遠心分離、その他、またはそれらの任意の組合せにより核酸単離を完了に向けて導く他のステップに供してもよい。ゲノムの核酸を、水、Tris緩衝液、または他の緩衝液等の溶液または緩衝液に再懸濁してもよい。ある特定の実施形態では、ゲノムの核酸を、Qiagen DNA水和溶液、または約7.5のpHの他のTris系緩衝液に再懸濁してもよい。単離された核酸(例えば、DNA、RNA、cDNA等)は、プローブ捕捉を増強するために断片化してもよい。核酸断片化の方法は、当技術分野で公知であり、これらに限定されないが、DNase消化、超音波処理、および機械的剪断等が挙げられる。米国特許出願公開第2005/0112590号には、当技術分野で公知の種々の断片化法の基本的な概要が提供されている。米国特許出願公開第2013/0274146号では、核酸標的の断片化が考察されている。また、核酸は、噴霧化、ハイドロ剪断、または超音波処理等により煎断することができる。米国特許第6,719,449号、米国特許第6,948,843号、および米国特許第6,235,501号を参照されたい。ある特定の実施形態では、試料核酸は、任意の好適な捕捉方法、またはハイブリダイゼーション捕捉等のアッセイ、または分子反転プローブ(MIP)の1つもしくは複数等のプローブによる捕捉を使用して、捕捉または標的とされる。
【0025】
図2には、増幅および配列決定に関して、標的ゲノム物質203の領域を捕捉するためのMIP201の使用が例示されている。各MIP201は、共通の骨格配列、および目的のDNA試料にアニーリングする2つの相補的アーム部分を含む。ポリメラーゼ205を使用して、2つのアーム部分の各々の間のギャップを埋め、その後リガーゼ221を使用して、1セットの環状分子を生成する。核酸断片上の標的配列に対するMIPの捕捉効率は、ハイブリダイゼーション期間、およびギャップを埋めるインキュベーション期間を延長することにより最適化することができる。(例えば、Turnerら、2009年、Massively parallel exon capture and library-free resequencing across 16 genomes、Nature Methods、6巻:315〜316頁を参照)。得られた環状分子211を、ポリメラーゼ連鎖反応を使用して増幅し、標的化配列決定ライブラリーを生成することができる。
【0026】
MIPを使用して、複雑な混合物中の特定の核酸配列を検出または増幅することができる。分子反転プローブの使用は、一塩基多型の検出(Hardenbolら、2005年、Highly multiplexed molecular inversion probe genotyping: over 10,000 targeted SNPs genotyped in a single tube assay、Genome Res、15巻:269〜75頁)、および大規模セットのエクソンの調製用増幅(Porrecaら、2007年、Multiplex amplification of large sets of human exons、Nat Methods、4巻:931〜6頁およびKrishnakumarら、2008年、A comprehensive assay for targeted multiplex amplification of human DNA sequences、PNAS、105巻:9296〜301頁)が実証されている。一般的に、数千のプローブを含む単一反応物中で数千の標的を捕捉することができるため、本方法の重要な1つの利益は、高度な多重化能力にある。
【0027】
一部の実施形態では、各反応に使用される標的核酸およびプローブの量を標準化して、濃度または比率の差により引き起こされるあらゆる差異の観察を回避する。一部の実施形態では、ゲノムDNAおよびプローブを標準化するため、標準的な分光光度計を使用して、または蛍光により(例えば、蛍光性挿入色素を使用して)ゲノムDNA濃度を測定する。プローブ濃度は、実験的に決定してもよく、またはプローブ製造業者が指定する情報を使用して決定してもよい。
【0028】
遺伝子座を捕捉したら、それを、1つまたは複数のプライマーが関与する反応で増幅および/または配列決定してもよい。各反応に添加されるプライマーの量は、0.1pmol〜1nmol、0.15pmol〜1.5nmolの範囲であってもよい(例えば、約1.5pmol)。しかしながら、他の量(例えば、より少ない量、より多い量、または中間の量)を使用してもよい。
【0029】
標的指向性アーム部分は、分析されている目的の核酸の遺伝子座のいずれかの鎖にハイブリダイズするように(例えば、相補的であるように)設計してもよい。MIPプローブは、一方の標的指向性アーム部分に対してどちらの鎖が選択された場合でも、他方の鎖が使用されることになる。また、本明細書では標的配列を「捕捉する」とされているMIPプローブは、実際の標的分子を捕捉することによってではなく(例えば、アーム部分がそれにハイブリダイズする初期段階ではなく、または標的分子が、変性もしくはそうでなければ除去されるまで、伸長MIP産物に結合したままであり得るという意味ではなく)、実際には、鋳型に基づく合成により捕捉される。他のMIP捕捉技法は、参照により組み込まれる米国特許出願公開第2012/0165202号に示されている。
【0030】
複数のプローブ、例えば複数のMIPを使用して、各標的核酸を増幅してもよい。一部の実施形態では、所定の標的のためのプローブのセットは、標的にわたって「タイリング」するように設計して、一連のより短い部分標的として標的を捕捉してもよい。一部の実施形態では、所定の標的のためのプローブのセットが、標的にわたって「タイリング」するように設計されている場合、セット中の一部のプローブは、隣接する非標的配列を捕捉する。あるいは、異なる標的指向性アーム部分を有する複数のプローブにより全長標的が捕捉(一部の場合では、隣接する非標的配列を捕捉)されるように、セットを、標的に隣接するハイブリダイゼーション領域の正確な位置に対して「付着(stagger)」するように設計して、タイリングの必要性を不要にすることができる。選択する特定の手法は、標的セットの性質に依存する。例えば、短い領域を捕捉しようとする場合、付着末端手法(staggered−end approach)が適切であり得るが、より長い領域が所望の場合は、タイリングを選択してもよい。全ての場合、病因遺伝子座を標的とするプローブのバイアス許容性の量は、所定の分子を捕捉するために使用される異なるMIPの数を変更することにより調整することができる。MIP捕捉反応用のプローブは、プログラム可能なマイクロアレイ上で合成して、必要とされる多数の配列を準備してもよい。例えば、Porrecaら、2007年、Multiplex amplification of large sets of human exons、Nat Meth、4巻(11号):931〜936頁;Garber、2008年、Fixing the front end、Nat Biotech、26巻(10号):1101〜1104頁;Turnerら、2009年、Methods for genomic partitioning、Ann Rev Hum Gen、10巻:263〜284頁;およびUmbargerら、2014年、Next-generation carrier screening、Gen Med、16巻(2号):132〜140頁を参照されたい。本明細書に記載の方法を使用すると、特定の標的核酸の単一コピーを、配列決定ができるレベルに増幅することができる。さらに、PCR等の増幅プロセスにより生成される増幅セグメントは、それら自体が、その後のPCR増幅の効率的な鋳型であってもよい。
【0031】
図2に示されているMIP捕捉の結果は、その後、様々な様式で処理することができる1つまたは複数の環状標的プローブを含む。一般的なリンカー媒介性PCRの間に配列決定用アダプターを付加して、非ランダムの固定されている配列決定用出発点を有するライブラリーをもたらしてもよい。ショットガンライブラリーを調製する場合、環状標的プローブに対して、一般的なリンカー媒介性PCRを実施し、捕捉後、増幅産物(amplicons)を直線状に連鎖させ、剪断し、そして配列決定用アダプターに付加する。方法は、増幅アダプターまたは配列決定アダプターまたはバーコードまたはそれらの組合せの付加を含み得、プローブにより捕捉されたDNAを標的とする。
【0032】
増幅アダプターまたは配列決定アダプターまたはバーコードまたはそれらの組合せは、断片化された核酸に付加してもよい。そのような分子は、Integrated DNA Technologies(Coralville、IA)等から、商業的に入手することができる。ある特定の実施形態では、そのような配列は、リガーゼ等の酵素を用いて鋳型核酸分子に付加される。好適なリガーゼとしては、T4 DNAリガーゼおよびT4 RNAリガーゼが挙げられ、それらはNew England Biolabs(Ipswich、MA)から商業的に利用可能である。ライゲーションは、平滑末端であってもよく、または相補的な突出末端の使用によるものであってもよい。
【0033】
ある特定の実施形態では、1つまたは複数のバーコードは、断片の各々、いずれか、または全てに付加される。バーコード配列は、一般的に、配列決定反応に有用な配列を製作する、ある特定の特徴を含む。バーコード配列は、各配列が核酸の特定の部分に相関しており、配列リードが、それらの由来する部分に戻って相関することを可能にするように設計されている。バーコード配列のセットを設計するための方法は、例えば、米国特許第6,235,475号に示されている。その内容は、それらの全体が参照により本明細書に組み込まれる。ある特定の実施形態では、バーコード配列は、約5個のヌクレオチドから約15個のヌクレオチドまでの範囲である。特定の実施形態では、バーコード配列は、約4個のヌクレオチドから約7個のヌクレオチドまでの範囲である。ある特定の実施形態では、バーコード配列は、例えば、酵素を用いて鋳型核酸分子に付加される。酵素は、上記で考察されているように、リガーゼまたはポリメラーゼであってもよい。核酸鋳型へのバーコード配列の付加は、米国特許出願公開第2008/0081330号および米国特許出願公開第2011/0301042号に示されている。これら文献の各々の内容は、その全体が参照により本明細書に組み込まれる。バーコード配列のセットを設計するための方法、およびバーコード配列を付加するための他の方法は、米国特許第7,537,897号、第6,138,077号、第6,352,828号、第5,636,400号、第6,172,214号、および第5,863,722号に示されている。これら文献の各々の内容は、その全体が参照により本明細書に組み込まれる。任意の処理ステップ(例えば、取得、単離、断片化、増幅、またはバーコード付加)後に、核酸を配列決定してもよい。
【0034】
3.配列決定
配列決定は、当技術分野で公知の任意の方法によるものであってもよい。DNA配列決定技法としては、以下のものが挙げられる:標識ターミネーターまたはプライマーが使用され、ゲル分離がスラブまたは毛細管中で行われる古典的なジデオキシ配列決定反応(サンガー法)、可逆的終端標識ヌクレオチドが使用される合成による配列決定法(sequencing by synthesis)、ピロシーケンス法、454配列決定法(454 sequencing)、Illumina/Solexa配列決定法、標識オリゴヌクレオチドプローブのライブラリーに対する対立遺伝子特異的ハイブリダイゼーション、標識クローンのライブラリーに対する対立遺伝子特異的ハイブリダイゼーションおよびその後ライゲーションが使用される合成による配列決定法、重合ステップ中の標識ヌクレオチドの組み込みのリアルタイムモニタリング、ポロニー配列決定法(polony sequencing)、およびSOLiD配列決定法。分離された分子は、ポリメラーゼまたはリガーゼを使用した連続のまたは単一の伸長反応により、ならびにプローブのライブラリーとの単一のまたは連続の差別的ハイブリダイゼーションにより配列決定してもよい。
【0035】
使用することができる配列決定技法は、例えば、Illumina配列決定法を含む。Illumina配列決定法は、ホールドバックPCR(fold−back PCR)およびアンカープライマーを使用した固体表面でのDNA増幅に基づく。ゲノムDNAを断片化し、断片の5’および3’末端にアダプターを追加する。フローセルチャネルの表面に付加されているDNA断片を伸長させ、架橋増幅する。断片は二本鎖になり、二本鎖分子を変性させる。固相増幅し、その後変性させるサイクルを複数回繰り返すことにより、フローセルの各チャネルに、およそ1,000コピーの同じ鋳型の一本鎖DNA分子の数百万個のクラスターを生成することができる。プライマー、DNAポリメラーゼ、および4つのフルオロフォア標識可逆的終端ヌクレオチドを使用して、連続配列決定を実施する。ヌクレオチド取り込み後、レーザを使用してフルオロフォアを励起させ、画像を捕捉し、最初の塩基の同一性を記録する。各組み込まれた塩基から3’ターミネーターおよびフルオロフォアを除去し、取り込みステップ、検出ステップ、および特定ステップを繰り返す。この技術による配列決定は、米国特許第7,960,120号、米国特許第7,835,871号、米国特許第7,232,656号、米国特許第7,598,035号、米国特許第6,911,345号、米国特許第6,833,246号、米国特許第6,828,100号、米国特許第6,306,597号、米国特許第6,210,891号、米国特許出願公開第2011/0009278号、米国特許出願公開第2007/0114362号、米国特許出願公開第2006/0292611号、および米国特許出願公開第2006/0024681号に記載されている。これら文献の各々は、それらの全体が参照により組み込まれる。
【0036】
配列決定は、複数の配列リードをもたらす。リードは、一般的に、ヌクレオチドデータの配列を含み、リード長は、配列決定技術と関連し得る。例えば、Pacific Bioの単一分子リアルタイム(SMRT)配列決定技術は、長さが何千個の塩基対のリードをもたらす。454ピロシーケンスの場合、リード長は、長さが約700bpであり得る。一部の実施形態では、リードは、長さが約500塩基未満、または長さが約150塩基未満、または長さが約90塩基未満である。ある特定の実施形態では、リードは、約80〜約90塩基であり、例えば、長さが約85塩基である。一部の実施形態では、リードは、非常に短く、つまり長さが約50塩基未満、または約30塩基未満である。配列リード251を分析して、標的核酸203の欠失303を検出および記述することができる。
【0037】
図3には、バリアント検出113のワークフローのダイヤグラムが示されている。ゲノムDNA203を、開始試料として使用し、複数のMIP201と接触させる。MIPのハイブリダイゼーションは、環状化プローブ産物211をもたらす。バーコードPCRを実施して、配列決定用の増幅産物物質を提供する。その後、増幅産物を配列決定し得る。配列決定は、複数の配列リードをもたらす。
【0038】
配列リードデータは、例えば、当業者に公知の、VCFファイル、FASTAファイル、またはFASTQファイルを含む、任意の好適なファイルフォーマットで保存することができる。一部の実施形態では、PCR産物は、プールして配列決定する(例えば、Illumina HiSeq2000で)。生の.bclファイルを、bclConverter(Illumina)を使用して、qseqファイルに変換する。関連するバーコードリードを使用して、ゲノムリードを「脱バーコード」することによりFASTQファイルを生成する。バーコードが、予想バーコードに対する正確なマッチをもたらさないか、または1つもしくは複数の低品質塩基コールを含むリードを廃棄してもよい。リードは、例えば、FASTAまたはFASTQフォーマット等の任意の好適なフォーマットで保存することができる。
【0039】
FASTAは、元々は、配列データベースを探索するためのコンピュータプログラムであり、FASTAという名称は、標準ファイルフォーマットを指すためにも使用されている。PearsonおよびLipman、1988年、Improved tools for biological sequence comparison、PNAS、85巻:2444〜2448頁を参照されたい。FASTAフォーマットの配列は、単一行の説明で始まり、その後に配列データ行が続く。説明行は、1列目の大なり記号(「>」)により、配列データと区別される。「>」記号後の単語は、配列の識別子であり、この行の残りは、説明である(両方とも任意選択である)。「>」と識別子の最初の文字との間にスペースは存在してはならない。テキスト行は全て、80文字よりも短いことが推奨されている。配列は、「>」で始まる別の行が現れると終了し、これは、別の配列の始まりであることを示す。
【0040】
FASTQフォーマットは、生物学的配列(通常は、ヌクレオチド配列)およびその対応する品質スコアを両方とも保存するためのテキスト系フォーマットである。これは、FASTAフォーマットに類似しているが、配列データの後に品質スコアが記載されている。配列文字および品質スコアは両方とも、簡潔さのため単一ASCII文字でコードされている。FASTQフォーマットは、Illuminaゲノムアナライザー等のハイスループット配列決定装置の出力を保存するためのデファクトスタンダードである。Cockら、2009年、The Sanger FASTQ file format for sequences with quality scores, and the Solexa/Illumina FASTQ variants、Nucleic Acids Res、38巻(6号):1767〜1771頁。
【0041】
FASTAおよびFASTQファイルの場合、メタ情報は、説明行を含むが、配列データ行を含まない。一部の実施形態では、FASTQファイルの場合、メタ情報は、品質スコアを含んでいる。FASTAおよびFASTQファイルの場合、配列データは、説明行の後から始まり、代表的には、任意選択で「−」と共にIUPAC多義的コードの一部サブセットを使用して提示されている。好ましい実施形態では、配列データには、A、T、C、G、およびNの文字が使用され、任意選択で「−」または必要に応じてU(例えば、それぞれギャップまたはウラシルを表す)が含まれることになる。
【0042】
配列決定後、当技術分野で公知であるか、またはワークフローで使用するために開発されたアセンブリ技法およびアラインメント技法を使用して、リードを参照に対してマッピングしてもよい。配列リードをコンティグへとアセンブリすることを含む、配列リードをアラインメントおよびアセンブリするための種々の戦略は、参照により本明細書に組み込まれる米国特許第8,209,130号に詳細に記載されている。戦略としては、(i)リードをコンティグへとアセンブリし、コンティグを参照に対してアラインすること;(ii)個々のリードを参照に対してアラインすること;(iii)リードをコンティグへとアセンブリし、コンティグを参照に対してアラインし、個々のリードをコンティグに対してアラインすること;または(iv)開発されていることが公知であるか、または当技術分野で公知の他の戦略が挙げられる。配列アセンブリは、参照に基づくアセンブリ、de novoアセンブリ、アラインメントによるアセンブリ、または組合せの方法を含む、当技術分野で公知の方法により行うことができる。配列アセンブリは、米国特許第8,165,821号、米国特許第7,809,509号、米国特許第6,223,128号、米国特許出願公開第2011/0257889号、および米国特許出願公開第2009/0318310号に記載されている。これら文献の各々の内容は、それらの全体が参照により本明細書に組み込まれる。配列アセンブリまたはマッピングには、アセンブリステップ、アラインメントステップ、または両方を使用してもよい。アセンブリは、例えば、カナダのマイケルスミスゲノム科学センター(Vancouver、B.C.、カナダ)のプログラム「The Short Sequence Assembly by k−mer search and 3’read Extension」(SSAKE)(例えば、Warrenら、2007年、Assembling millions of short DNA sequences using SSAKE、Bioinformatics、23巻:500〜501頁を参照)により実施することができる。SSAKEでは、リードの表全体を探し回り、任意の2つの配列間の可能な限り長いオーバーラップを求めてプレフィックスツリーを探索する。SSAKEでは、リードは、コンティグへとクラスター化される。
【0043】
一般的に、リードアセンブリおよび分析は、1つまたは複数の専用コンピュータプログラムを使用することにより進められる。1つのリードアセンブリプログラムは、Darren PlattおよびDirk Eversが作成し、Geeknet(Fairfax、VA)により維持されているSourceForgeウェブサイトから利用可能なForge Genome Assemblerである(例えば、DiGuistiniら、2009年、De novo sequence assembly of a filamentous fungus using Sanger, 454 and Illumina sequence data、Genome Biology、10巻:R94頁を参照)。Forgeでは、その計算およびメモリ消費は、利用可能な場合、複数のノードに分散され、したがって、大規模セットのリードをアセンブリする能力を有する。Forgeは、並列MPIライブラリーを使用してC++で書かれた。Forgeは、例えば、サンガーリード、454リード、およびIlluminaリードの混在リードを扱うことができる。
【0044】
当技術分野で公知の別の例示的なリードアセンブリプログラムは、欧州生物情報研究所(Hinxton、英国)のウェブサイトから利用可能なVelvetである(ZerbinoおよびBirney、Velvet: Algorithms for de novo short read assembly using de Bruijn graphs、Genome Research、18巻(5号):821〜829頁)。Velvetでは、de Bruijnグラフに基づく手法が実施され、リード対の情報が使用され、種々のエラー補正ステップが実施される。
【0045】
リードアセンブリは、北京ゲノム研究所(北京、中国)またはBGI Americas Corporation(Cambridge、MA)のウェブサイトから利用可能なパッケージSOAPのプログラムで実施してもよい。例えば、SOAPdenovoプログラムでは、de Bruijnグラフ手法が実施される。SOAP3/GPUでは、短いリードが、参照配列に対してアラインされる。
【0046】
別のリードアセンブリプログラムは、カナダのマイケルスミスゲノム科学センター(Vanouver、B.C.、カナダ)のABySSである(Simpsonら、2009年、ABySS: A parallel assembler for short read sequence data、Genome Res.、19巻(6号):1117〜23頁)。ABySSでは、de Bruijnグラフ手法が使用され、並列環境で実行される。
【0047】
また、リードアセンブリは、gsAssemblerまたはNewbler(NEW assemBLER)としても公知の、Roche454シーケンサーからのリードをアセンブリするように設計されているRocheのGS De Novo Assemblerにより行ってもよい(例えば、KumarおよびBlaxter、2010年、Comparing de novo assemblers for 454 transcriptome data、Genomics、11巻:571頁およびMargulies、2005年に記載されている)。Newblerは、454Flx標準リードおよび454Titaniumリード、ならびに単一リードおよびペアエンドリード、ならびに任意選択でサンガーリードを受け付ける。Newblerは、32ビットバージョンまたは64ビットバージョンのいずれかのリナックス(登録商標)上で実行される。Newblerは、コマンドラインまたはJava(登録商標)系GUIインタフェース経由でアクセスすることができる。リードアセンブリの追加の考察は、以下の文献に見出すことができる:Liら、2009年、The Sequence alignment/map (SAM) format and SAMtools、Bioinformatics、25巻:2078頁;Linら、2008年、ZOOM! Zillions Of Oligos Mapped、Bioinformatics、24巻:2431頁;LiおよびDurbin、2009年、Fast and accurate short read alignment with Burrows-Wheeler Transform、Bioinformatics、25巻:1754頁;およびLi、2011年、Improving SNP discovery by base alignment quality、Bioinformatics、27巻:1157頁。アセンブリされた配列リードは、好ましくは、参照に対してアラインしてもよい。アラインメント法は、当技術分野で公知であり、Burrows−Wheeler Aligner等の、アラインメントを実施するコンピュータプログラムを使用してもよい。
【0048】
3.バリアントコーリング
アラインまたはアセンブリされた配列リードを、バリアント、例えば、所定の参照のバリアントであると記載または「コールされた」突然変異の存在について分析してもよい。突然変異コーリングは、米国特許出願公開第2013/0268474号に記載されている。ある特定の実施形態では、リードの分析は、配列リードをアセンブリすること、およびその後アセンブリしたリードを遺伝子型決定することを含む。
【0049】
ある特定の実施形態では、リードは、短いアラインメント用のBurrows−Wheeler Alignerバージョン0.5.7を使用して、試料毎の単位でhg18に対してアラインし、遺伝子型コールは、Genome Analysis Toolkitを使用して行う。McKennaら、2010年、The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data、Genome Res、20巻(9号):1297〜1303頁(別名GATKプログラム)を参照されたい。高信頼性の遺伝子型コールは、深さ≧50およびストランドバイアススコア≦0を有すると規定することができる。脱バーコードfastqファイルを上述のように得、標的アーム部分配列を固有キーとして使用して捕捉領域(エクソン)によってパーティション化する。リードを、SSAKEバージョン3.7を「−m 30 −o 15」のパラメータで使用して、エクソンにより並列でアセンブリする。得られた連続配列(コンティグ)を、hg18に対してアラインしてもよい(例えば、長いアラインメント用のBWAバージョン0.5.7を、パラメータ「−r 1」で使用)。一部の実施形態では、短いリードのアラインメントは、試料コンティグ(hg18ではなく)を入力参照配列として使用する以外は、上記と同様に実施される。BAMフォーマットアラインメント毎に、座標データおよびバリアントデータ(ギャップ)を、ローカル試料スペースからグローバル参照スペースへと正確に変換するためのソフトウェアをJava(登録商標)で開発してもよい。GATKプログラムを使用して、座標変換されたBAMファイルに対して遺伝子型決定および塩基品質再較正を実施してもよい。
【0050】
一部の実施形態では、本発明のステップのいずれかまたは全ては、自動化されている。例えば、Perlスクリプトまたはシェルスクリプトを書いて、上記で考察されている種々のプログラムのいずれも起動することができる(例えば、Tisdall、Mastering Perl for Bioinformatics、O'Reilly & Associates, Inc.、Sebastopol、CA、2003年;Michael, R.、Mastering Unix Shell Scripting、Wiley Publishing, Inc.、Indianapolis、Indiana、2003年を参照されたい)。あるいは、本発明の方法は、全体がまたは部分的に、例えば、各々は、任意選択でC++等のコンパイラ型言語で書かれ、その後コンパイルされ、バイナリとして配布される、1つまたは複数の専用プログラムで具現化されていてもよい。本発明の方法は、全体がまたは部分的に、既存の配列分析プラットフォーム内のモジュールとして、または既存の配列分析プラットフォーム内で機能を起動することにより実施してもよい。ある特定の実施形態では、本発明の方法は、単一の開始合図(例えば、人の活動、別のコンピュータプログラム、または機械からの開始事象の1つまたは組合せ)に応答して、全て自動的に起動される幾つかのステップを含む。したがって、本発明は、ステップのいずれかまたはステップの任意の組合せが、合図に応答して自動的に生じ得る方法を提供する。「自動的に」は、一般的に、人による入力、影響、または相互作用が介在しない(つまり、最初のまたは合図前の人の活動にのみ応答する)ことを意味する。
【0051】
図3の参照を継続するが、参照に対する配列リードのマッピング323は、戦略がいかなるものであっても、参照ゲノムの配列に対してアラインされた核酸の配列等の配列データを含む、テキストファイルまたはXMLファイル等の出力を生成することができる。ある特定の実施形態では、リードを参照にマッピングすることにより、SAMまたはBAMファイルに保存された結果が生成され(例えば、図3に示されているように)、そのような結果は、参照ゲノムと比較した、対象核酸の1つまたは複数の突然変異を記述する座標または文字列を含んでいてもよい。当技術分野で公知のアラインメント文字列としては、Simple UnGapped Alignment Report(SUGAR)、Verbose Useful Labeled Gapped Alignment Report(VULGAR)、およびCompact Idiosyncratic Gapped Alignment Report(CIGAR)が挙げられる。Ningら、2001年、SSAHA: A fast search method for large DNA database、Genome Research、11巻(10号):1725〜9頁を参照されたい。こうした文字列は、例えば、欧州生物情報研究所(Hinxton、英国)のExonerate配列アラインメントソフトウェアに実装されている。
【0052】
一部の実施形態では、例えば、CIGAR文字列を含む、配列アラインメントマップ(SAM)またはバイナリアラインメントマップ(BAM)ファイル329等の、配列アラインメントが生成される(SAMフォーマットは、例えば、Liら、The Sequence Alignment/Map format and SAMtools、Bioinformatics、2009年、25巻(16号):2078〜9頁に記載されている)。一部の実施形態では、CIGARは、ギャップ付きアラインメントを、1行につき1つ表示または含む。CIGARは、CIGAR文字列として報告される、圧縮されたペアワイズアラインメントフォーマットである。CIGAR文字列は、長い(例えば、ゲノムの)ペアワイズアラインメントを表すのに有用である。CIGAR文字列は、参照ゲノム配列に対するリードのアラインメントを表すために、SAMフォーマットで使用される。
【0053】
CIGAR文字列の後には、確立されたモチーフが続く。各文字の前には、事象の塩基数を示す数字が付く。使用される文字としては、M、I、D、N、およびSを挙げることができる(M=マッチ;I=挿入;D=欠失;N=ギャップ;S=置換)。CIGAR文字列には、マッチ/ミスマッチおよび欠失(またはギャップ)の配列が規定される。例えば、CIGAR文字列2MD3M2D2Mは、アラインメントが、2つのマッチ、1つの欠失(数字1は、スペースを節約するため省略される)、3つのマッチ、2つの欠失、および2つのマッチを含むことを意味するだろう。一般的に、図3に描かれているNGSワークフロー等の、キャリアスクリーニングまたは他のアッセイの場合、配列決定結果は、遺伝子型決定に使用される。
【0054】
マッピングからの出力は、バリアントコールフォーマット(VCF)ファイル335、または他のフォーマットで、SAMまたはBAMファイルに保存してもよい。例示的な実施形態では、出力は、VCFファイルに保存される。代表的なVCFファイルは、ヘッダーセクションおよびデータセクションを含む。ヘッダーは、各々が文字「##」で始まる任意の数のメタ情報行、および単一の「#」文字で始まるTAB区切りフィールド定義行を含む。フィールド定義行は、8列の必須列を命名し、本文セクションは、フィールド定義行により定義された列に加えられるデータ行を含む。VCFフォーマットは、Danecekら、2011年、The variant call format and VCFtools、Bioinformatics、27巻(15号):2156〜2158頁に記載されている。
【0055】
VCFファイルに含まれるデータは、患者の試料から得られ、配列決定された核酸に見出されるバリアントまたは突然変異を表す。その元々の意味では、突然変異は、遺伝情報の変化を指すが、突然変異に起因する現在の遺伝子型を指すようになっている。当技術分野で公知のように、突然変異としては、置換、挿入、または欠失(INDEL)、転座、逆位、および染色体異常等の様々なタイプの突然変異が挙げられる。慣例により、遺伝情報または対立遺伝子の2つまたはそれよりも多くの型が知られている一部の状況では、集団中で優勢な頻度を示すと考えられるものを野生型と称し、他方は突然変異と呼ばれる。一般的に、一部の状況では、絶対的な対立遺伝子頻度は決定されないが(つまり、この惑星の全てのヒトが遺伝子型決定されるわけではない)、対立遺伝子頻度は、サンプリングおよび公知の統計的手法に基づき算出された推定対立遺伝子頻度を指し、対立遺伝子頻度は、ある特定の民族のヒト等の、ある特定の集団の観点で報告されることが多い。バリアントは、突然変異とほぼ同義的に解釈される場合があるが、参照の遺伝子型またはゲノムと比較してまたは参照して記述されている遺伝子型を指す。例えば、バイオインフォマティクスで使用される場合、バリアントは、ヒトゲノム等の参照(例えば、野生型とされ得るhg18またはhg19)と比較した遺伝子型特徴を記述する。本明細書に記載の方法は、1つまたは複数の突然変異または「バリアントコール」を表すデータを生成する。
【0056】
突然変異の記述は、系統的命名法により提供されていてもよい。例えば、バリアントは、変化していないとみなされており、名称または受託番号等の固有の表記により特定される指定参照と系統的に比較することにより記述してもよい。所定の遺伝子、コード領域、またはオープンリーディングフレームの場合、ATG開始コドンのAは、示されているヌクレオチド+1であり、+1に対するヌクレオチド5’は−1である(ゼロはない)。終止符で区切られる小文字のg、c、またはmの接頭辞は、それぞれゲノムDNA、cDNA、またはミトコンドリアDNAを示す。
【0057】
系統的名称を使用して、例えば、置換、欠失、挿入、および可変コピー数を含む、幾つかのバリアントタイプを記述してもよい。置換名称は、数字で始まり、その後「から〜へ」を表す記号が続く。したがって、199A>Gは、参照配列の199位にて、AがGに置換されていることを示す。欠失は、数字の後の「del」により示される。したがって、223delTは、nt223のTの欠失を示し、997−999delは、3つのヌクレオチドの欠失を示す(あるいは、この突然変異は、997−999delTTCと示すことができる)。ショートタンデムリピートでは、3’ntは、任意に割り当てられる。例えば、TG欠失は、1997−1998delTGまたは1997−1998delと命名される(ここで、1997は、Cの前の最初のTである)。挿入は、区間の後のinsにより示される。したがって、200−201insTは、Tが、nt200と201との間に挿入されていたことを示す。可変ショートリピートは、997(GT)N−N’と示される。ここで、997は、ジヌクレオチドGTの最初のヌクレオチドであり、その集団中でN〜N’回繰り返されている。
【0058】
イントロンでのバリアントは、インバリアントドナーGUのGからの距離を示す正の数、または受容部位AGのインバリアントGからの距離を示す負の数によるイントロン数を使用することができる。したがって、IVS3+1C>Tは、イントロン3のnt+1でのCからTの置換を示す。いずれの場合も、cDNAヌクレオチド付番を使用して、例えばイントロンでの突然変異の位置を示してもよい。したがって、c.1999+1C>Tは、cDNAのヌクレオチド1997の後のnt+1でのCからTの置換を示す。同様に、c.1997−2A>Cは、cDNAのヌクレオチド1997のnt−2上流でのAからCの置換を示す。全長ゲノム配列が既知の場合、突然変異は、参照配列のnt数で指定することもできる。
【0059】
患者のゲノムは、参照と比較して、1つよりも多い突然変異、または1つよりも多い文字列もしくは系統的名称により記述可能な複雑な突然変異により異なっている場合がある。本発明は、系統的名称を使用して、1つよりも多いバリアントを記述するための系および方法をさらに提供する。例えば、同じ対立遺伝子中の2つの突然変異は、以下のようにブラケット内に列挙してもよい:[1997G>T;2001A>C]。系統的命名法は、den DunnenおよびAntonarakis、2003年、Mutation Nomenclature、Curr Prot Hum Genet、7.13.1〜7.13.8、ならびにAntonarakisおよびthe Nomenclature Working Group、1998年、Recommendations for a nomenclature system for human gene mutations、Human Mutation、11巻:1〜3頁に考察されている。バリアント検出は、本発明の系を使用することを含む。1つの好適な系は、参照により組み込まれる米国特許第8,812,422号を参照されたい。バリアントは、HGVS推奨の命名法または任意の他の系統的突然変異命名法により命名されていてもよい。データベース中の突然変異(例えば、MIPキャリアスクリーニングの配列決定結果と比較するための)は、分類されていてもよい。本明細書に記載されている分類判定基準は、劣性メンデル型障害およびエフェクトサイズが比較的大きな高度に浸透性のバリアントに当てはまる。分類判定基準は、文献の推薦に従ってもよい:Richardsら、ACMG recommendations for standards for interpretation and reporting of sequence variations: Revisions 2007、Genet Med、2008年、10巻:294〜300頁;Maddalenaら、Technical standards and guidelines: molecular genetic testing for ultra-rare disorders、Genet Med、2005年、7巻:571〜83頁;およびStrom CM、Mutation detection, interpretation, and applications in the clinical laboratory setting、Mutat Res、2005年、573巻:160〜7頁。これら文献は、各々が参照により組み込まれる。分類は、配列に基づく根拠(例えば、短縮突然変異であること)、実験的根拠または遺伝的根拠(例えば、樹立バリアントである場合、またはバリアントが、対照よりも罹患個体で有意により高い頻度であることを示す統計的な根拠がある場合、遺伝的根拠に基づいて病原性であると分類される;MacArthurら、Guidelines for investigating causality of sequence variants in human disease、Nature、2014年、508巻:469〜76頁を参照)の任意の好適な組合せに基づいていてもよい。標準的NGSプロトコールにより検出可能なバリアントの検出に使用するのに好適な方法は、Umbargerら、Next-generation carrier screening、Genet Med、2014年、16巻:132〜40頁およびHallamら、Validation for Clinical Use of, and Initial Clinical Experience with, a Novel Approach to Population-Based Carrier Screening using High-Throughput, Next-Generation DNA Sequencing、J Mol Diagn、2014年、16巻:180〜9頁を参照されたい。これら文献は両方とも、参照により組み込まれる。
【0060】
任意の好適な遺伝子を、本発明の方法を使用してスクリーニングすることができる。好ましい実施形態では、本発明の方法を使用して、劣性メンデル型障害をスクリーニングする。本発明の方法を使用してスクリーニングすることができる、ある特定の遺伝障害およびそれらの関連遺伝子としては、カナバン病(ASPA)、嚢胞性線維症(CFTR)、糖原病1a型(G6PC)、ニーマン−ピック病(SMPD1)、テイ−サックス病(HEXA)、ブルーム症候群(BLM)、ファンコニ貧血C(FANCC)、家族性インシュリン過剰症(ABCC8)、メープルシロップ尿症1A型(BCKDHA)および1B型(BCKDHB)、アッシャー症候群III型(CLRN1)、ジヒドロリポアミドデヒドロゲナーゼ欠損(DLD)、家族性自律神経失調症(IKBKAP)、ムコリピド蓄積症IV型(MCOLN1)、ならびにアッシャー症候群1F型(PCDH15)が挙げられる。
【0061】
4.機能アセスメント
図4には、本発明の方法を実施するためのプラットフォームアーキテクチャが例示されている。プラットフォームは、例えば、アマゾンウェブサービス(AWS)等のウェブサービスインフラストラクチャ上に構築してもよい。サービスインフラストラクチャは、保存領域、計算モジュールまたは機能を提供することができる。生の配列データをアセンブリに持ち込むか、またはバリアントコーリングを患者のゲノムデータとする。科学文献は、自由に、例えば、Genospace(ケンブリッジ、MA)によりGENOSPACEという名称で販売されているサービス等の生物医学的分析用のゲノムプラットフォームにより統合されている。
【0062】
ゲノムプラットフォームに問い合わせることにより、バリアントに関する機能情報を得ることができる。そのような情報としては、以下のものを挙げることができる:バリアントがある場合、それはどの遺伝子内にあるのか;バリアントは、イントロン、エクソン、他の特徴の内側にあるのか外側にあるのか、もしくは境界をまたいでいるのか;バリアントは、オープンリーディングフレーム内にあるのか;あるいはバリアントは、フレームシフトもしくはミスセンスもしくはナンセンス突然変異または中途終止コドンもしくはサイレント突然変異を生成するのか。機能アセスメント117は、Genospace、Broad Inst.、Signifikance等のツールを使用して進行させ、バリアントの機能的な影響を査定してもよい。
【0063】
患者に報告または通知するために、本発明のシステムおよび方法を使用して、外部データベースから医学/臨床情報を検索してもよい。外部データベースは、好ましくは、Wolters−KluwerによるUP2DATE等の臨床判断支援システムである。システムにより問い合わせられる外部データベースには、任意の好適な臨床判断支援リソースが含まれていてもよい。他の好適なリソースとしては、Athena Health(ウォータータウン、MA)によりEPOCRATESという名称で販売されている医学文献リソースが挙げられる。アクセスすることができる他の臨床判断支援(CDS)リソースとしては、以下のものを挙げることができる:PREDICT(Pharmacogenomic Resource for Enhanced Decisions in Care and Treatment)プロジェクト、CLIPMERGE(Clinical Implementation of Personalized Medicine through Electronic Health Records and Genomics)プログラム、およびSMART(Substitutable Medical Apps Reusable Technologies)ゲノミクスアドバイザー。PREDICTプロジェクトは、電子記録StarPanelのCDS機能性を使用して、有効なCDSを提供する。PREDICTは、現在、先制検査および「ジャストインタイム」の徴候に基づく検査を両方とも含むように設計されている。現在まで、>11,000人の個体が、34個の遺伝子および184個のバリアントを含む、Illumina ADMEプラットフォームを使用して、PREDICTで検査されている。ゲノミクスアドバイザーは、独立型外部CDS技術として利用可能であるか、または他のアプリケーションに統合されていてもよい。
【0064】
外部データベースは、医学文献を自由に抽出したものであってもよい。具体的には、キュレータが医学文献を検討してデータベースを最新に維持している精選されたデータベースが使用される。代表的には、外部データベースは、医療データおよびメタデータを含み得る。医療データは、意図される内容であり(例えば、SQLハンドルを開くことにより加入者がアクセス可能である)、メタデータは、改訂履歴等の内部情報である。好ましい実施形態では、各更新に、その更新を特徴付けるメタデータが標識されている外部データベースが使用される。例えば、メタデータは、更新を、誤植の訂正;新しいSNPの追加;臨床試験の開始;新しいプライマーの公開;OMIMからトランスクルードされた突然変異の記載;著者リストの変更の1つまたは複数として識別することができる。フロントエンドモジュールは、ユーザに、ウェブまたはモバイルに基づくインタフェースを提供する。
【0065】
図5には、本発明の実施形態によるシステム501のダイヤグラムが示されている。システム501は、例えば、配列決定装置(例えば、IlluminaによるHiSeq2500またはMiSeq)であってもよい分析装置503を含んでいてもよい。装置503は、配列リードデータ等の結果データを得るためのデータ獲得モジュール505を含む。装置503は、任意選択で、それ自体の、例えば専用の分析コンピュータ533(入力/出力機構、1つまたは複数のプロセッサ、およびメモリを含む)を含んでいてもよく、または作動可能に接続されていてもよい。それに加えてまたはその代わりに、装置503は、ネットワーク509を介してサーバ513またはコンピュータ549(例えば、ラップトップ、デスクトップ、またはタブレット)と作動可能に接続されていてもよい。
【0066】
コンピュータ549は、1つまたは複数のプロセッサおよびメモリならびに入力/出力機構を含む。本発明の方法が、クライアント/サーバアーキテクチャを使用する場合、本発明の方法のステップは、プロセッサおよびメモリの1つまたは複数を含み、データ、命令等を得ることができるか、またはインタフェースモジュールを介して結果を提供することができるか、または結果をファイルとして提供することができるサーバ513を使用して実施される。サーバ513は、HitachiによりBLADEという商標で販売されているラックマウント型コンピュータ等の、単一または複数のコンピュータデバイスにより提供されていてもよい。サーバ513は、オンサイトまたはオフサイトまたはその両方にあるサーバのセットとして提供されていてもよい。サーバ513は、所有しているものであってもよく、サービスとして提供されるものであってもよい。サーバ513は、全部がまたは一部が、アマゾンウェブサービスまたはグーグル等のクラウド型リソースとして提供されていてもよい。クラウドリソースを含むことは、使用可能なハードウェアが、需要に応じて直ちにスケールアップおよびダウンされるため有益である。計算タスクを実施する実際のプロセッサ、つまり特殊シリコンチップは、情報処理がスケールアップおよびダウンすると共に任意に変更することができる。好ましい実施形態では、サーバ513は、クラウドリソースと協同して作動する1つまたは複数のローカルサーバボックスを含む(ここで、ローカルは、非クラウドを意味し、オンサイトまたはオフサイトを含む)。サーバ513は、コンピュータ549によりネットワーク509と連動していてもよく、そして一方または両方が、外部データベース567と連動していてもよい。
【0067】
システム501では、各コンピュータは、好ましくは、メモリおよび少なくとも1つの入力/出力(I/O)機構と接続されている少なくとも1つのプロセッサを含む。
【0068】
プロセッサは、一般的に、単コアまたはマルチコアチップ等のチップを含み、中央処理装置(CPU)を提供する。プロセスは、インテルまたはAMD製のチップにより提供されていてもよい。
【0069】
メモリは、開示されているコンピュータのいずれか1つのプロセッサにより実行されると、本明細書に記述されている方法または機能の一部または全てを達成することができる1つまたは複数のセットの命令(例えば、ソフトウェア)が保存されている1つまたは複数の機械可読デバイスを含んでいてもよい。また、ソフトウェアは、コンピュータシステムによりそれが実行されている間、メインメモリ内および/またはプロセッサ内に、完全にまたは少なくとも部分的に存在することができる。好ましくは、各コンピュータは、ソリッドステートドライブ、フラッシュドライブ、ディスクドライブ、ハードドライブ等の非一時的メモリを含む。例示的な実施形態では、機械可読デバイスは、単一の媒体であってもよいが、用語「機械可読デバイス」は、1つまたは複数のセットの命令および/またはデータを保存する単一の媒体または複数の媒体を含むと解釈されるべきである(例えば、中央集中型または分散型データベース、ならびに/または関連キャッシュおよびサーバ)。また、これらの用語は、機械に実行させるための命令のセットを保存、エンコード、または保持することが可能であり、本発明の方法のいずれか1つまたは複数を機械に実施せしめる任意の媒体を含むと解釈されるべきである。したがって、これらの用語は、限定ではないが、1つまたは複数のソリッドステートメモリ(例えば、加入者識別モジュール(SIM)カード、セキュアデジタルカード(SDカード)、マイクロSDカード、またはソリッドステートドライブ(SSD))、光および磁気媒体、ならびに/または任意の他の有形記憶媒体を含むと解釈されるべきである。
【0070】
本発明のコンピュータは、一般的に、例えば、ビデオ表示ユニット(例えば、液晶ディスプレイ(LCD)または陰極線管(CRT))、英数字入力デバイス(例えば、キーボード)、カーソル制御デバイス(例えば、マウス)、ディスクドライブユニット、シグナル発生デバイス(例えば、スピーカー)、タッチスクリーン、加速度計、マイクロホン、セルラー方式無線周波アンテナ、および例えばネットワークインタフェースカード(NIC)、Wi−Fiカード、またはセルラー方式モデムであってよいネットワークインタフェースデバイス等の1つまたは複数のI/Oデバイスを含み得る。
【0071】
ソフトウェアのいずれかは、物理的に種々の場所に配置されていてもよく、それには、機能の一部分が物理的に異なる場所に実装されるように分散されていることが含まれる。
【0072】
システム501またはシステム501の構成要素を使用して、本明細書に記載の方法を実施することができる。任意の方法ステップの命令は、メモリに保存されていてもよく、プロセッサは、それらの命令を実行することができる。システム501またはシステム501の構成要素は、ゲノム配列または配列リードの分析(例えば、欠失の検出およびバリアントコーリング)に使用することができる。
【0073】
システム501は、外部データベースまたはデータベース567と連動して、医療情報を得る。医療情報の第1の態様は、疾患関連性であり、別の重要な態様は、実際の行動に役立つ臨床情報を含む。
【0074】
図6には、医療情報に関するワークフローが図解されている。システムは、患者情報、ならびに臨床情報、ゲノムデータ、および患者加入情報を含むメタデータの格納場所を提供する。システム501は、精選された外部データベース567に、疾患関連性および報告する情報について問い合わせることができる。
【0075】
5.データ検索
疾患関連性121では、バリアントを、疾患および任意の追加情報と関連付けてもよい。例えば、情報は、手動キュレーションおよび自動キュレーションを系統的に意味的に制御して組み合わせることにより、Genospace、OMIM、またはRancho Biosciences等のリソースから得ることができる。代表的には、バリアントについての疾患関連性は、そのバリアントと関連することが知られている任意の疾患を提供する。多数のバリアント(例えば、数百〜数千)の場合、疾患関連性は、既存の内部データベースにより提供されてもよい。例えば、機能アセスメントは、嚢胞性線維症膜貫通型受容体内のSNPを捜し出すことができ、そのSNPは、疾患嚢胞性線維症と関連するため、サーバ513内の内部データベースで既に追跡されていてもよい(例えば、参照により組み込まれる米国特許第8,812,422号を参照)。疾患関連性に加えて、本発明のシステムは、提供される患者報告書に、実際の行動に役立つ医療情報を含んでいてもよい。
【0076】
医学的テキストは、外部データベースとしての臨床判断支援リソース等の外部ソースに問い合わせることにより提供することができる。1つの好適な製品は、Wolters−Kluwer社によりUP2DATEという商標で提供されている臨床判断支援リソースである。本発明のシステムおよび方法では、指定の疾患に関する、外部データベースからの構造化された実際の行動に役立つ医療情報に自動的にアクセスし、外部データベースの新しい「タグ化コンテンツ」に基づく更新のカスタム統合を提供する。本発明のシステムは、指定の疾患に関する、構造化された実際の行動に役立つ医療情報の自動アクセスを実施する。更新のカスタム統合は、外部データベースの新しい「タグ化コンテンツ」に基づいていてもよい。
【0077】
図7には、更新された報告書が利用可能であることをユーザに通知すべきか否か判断するための方法701が図解されている。まず、システムは、患者の身元、バリアントコール、およびバリアントに関する臨床情報を含む報告書をユーザに提供することができ、その後、更新された臨床情報を有する更新された報告書を提供することも可能である。初期の報告書は、精選されたバリアント解釈データについて、外部データベース567に問い合わせる707ことにより提供されてもよい。
【0078】
その後、システム513は、臨床情報に対する更新が公開されているか否かを決定する。これは、現在の情報を、突然変異に関する患者の報告書で最後に使用された情報と単に比較することにより行うことができる。更新が存在している場合、システムは、更新が重要性の所定の判定基準を満たすか否かを評価713し、重要性の所定の判定基準を満たす更新された臨床情報をユーザに通知723する。システムを使用して、特に更新されたデータについて外部データベース567に問い合わせる719ことにより新しい報告書を作成し、好ましくはバリアントと関連する新しい臨床情報を含む新しい報告書を提供することができる。関連する新しい臨床情報は、機能情報、疾患関連性、および医療情報の1つまたは複数を含んでいてもよい。好ましくは、新しい臨床情報は、配列データ中のバリアントと、医学的状態、予後、治療レジメン、または疾患罹患傾向との関連性に関する更新された情報を含む。
【0079】
図8は、更新の重要性を決定するためのフローチャートである。評価するステップは、データベースに入力されるメタデータを読み取ることを含む。メタデータは、更新の出所、更新の日付、または所定の判定基準等の情報を含んでいてもよい。
【0080】
新しい情報の重要性の評価は、変化の範囲および特定の患者に対する影響を両方とも考慮に入れることができる。したがって、評価は、範囲アセスメント715および影響アセスメント721を含んでいてもよい。
【0081】
範囲アセスメント715は、更新の実体を検討する。代表的には、外部データベースでは、キュレータが、更新を、その更新を特徴付けるメタデータにタグ付けし得る。外部データベースは、メタデータタグの規定された概要を提供することができ、システム513は、更新の範囲または実体を示すある特定の所定のタグのメタデータを読み取るようにプログラムされていてもよい。範囲アセスメントで、および範囲アセスメントが「はい、続行する」または「いいえ、報告しない」をもたらすか否かについて読み取ることができる例示的なタグとしては、例えば、以下のものを挙げることができる:<些細な編集></些細な編集>「N」;<新しい疾患></新しい疾患>「Y」;<受託番号の割り当て></受託番号の割り当て>「N」;および<FDA治療認可></FDA治療認可>「Y」。
【0082】
影響アセスメント721は、更新が、特定の突然変異を有する患者に適用可能であるか否か問い合わせる。例えば、疾患表現型が、SNP近位にインデルを必要とすることが知られている場合、SNPを有するがインデルは有していない患者の場合、SNPに関する新しい医療情報は、その患者にとって影響はないと決定することができる。したがって、範囲アセスメント715および影響アセスメント721により、例えば、一部の人口統計学的集団における疾患の発症率にわずかな変更が報告された場合、一部の更新を、些細なものと見なし、無視することができる。加えて、更新があっても、患者に関係がない場合は通知を開始する必要はなく、例えば、SNPが前立腺がんに関連付けられている場合、女性患者には緊急通知をしなくともよい。
【0083】
更新および通知ステップは、1回、複数回、定期的に、周期的に、オンデマンドで、または任意の他の所望のスケジュールで実施することができる(例えば、決定するステップ、評価するステップ、および通知するステップは、少なくとも1週間にわたって複数の異なる更新について複数回実施される)。
【0084】
本発明のシステムおよび方法は、例えば、モバイルアプリまたはデスクトップウェブアプリを介してユーザインタフェース131を提供する。ユーザインタフェースは、更新されたデータの個別化アクセスを提供する。医師もしくは遺伝相談員または医師もしくは遺伝相談員の患者は、ユーザに自動的にプッシュ送信される関連情報の精選された更新により生成されるアラートを受け取ることができる。
【0085】
参照による組み込み
特許、特許出願、特許刊行物、学術誌、書籍、論文、ウェブコンテンツ等の他の文献が、本開示の全体にわたって参照または引用されている。そのような文献は全て、それらの全体があらゆる目的のための参照により本明細書中に組み込まれる。
【0086】
等価形態
本明細書に示されているものおよび記載されているものに加えて、本発明およびその多数のさらなる実施形態に対する種々の改変は、当業者であれば、本明細書に引用されている科学的文献および特許文献への参照を含む本書類の全内容から明らかになる。本明細書の主題は、その種々の実施形態およびその等価形態にて本発明を実施するように構成することができる重要な情報、例示、および指針を含む。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【国際調査報告】