导航:首页 > 生物信息 > 如何使用生物信息学分析一个基因

如何使用生物信息学分析一个基因

发布时间：2023-01-07 15:32:10

Ⅰ 如何利用生物信息学研究基因的进化

首先进行基因分类,比如说编码性基因占多大比例,非编码性基因又占多少比例；转录因子占多少比例,蛋白激酶类基因又占多少比例等等。
然后将该物种基因组与其它已测序基因组进行比较,包括大小、同源度等等。

生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播，分析和解释等各方面的学科，也是随着生命科学和计算机科学的迅猛发展，生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学，计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。

Ⅱ 对于一个基因，生物信息学分析都要分析什么

楼主的问题问的太宽泛了。请问你是具体问题出在哪里呢？你可以利用Biomart这个工具（www.biomart.org），找到种间的orthlogue关系以及各种类型的注释ID直接的对应关系。你也可以用ncbi里面的homologene数据库去找种间的同源序列.multiple alignment可以用clust W或者mega做。系统发育树可以用mega做。PHYLIP好像也可以。基因结构上可以做做gc含量，外显子大小，splicing，调控序列什么的蛋白结构预测软件很多，不过我没做过。ncbi有一个conserved domain 的数据库，你可以和他比较下，分析下结构域。表达情况。。。。你可以找找相关的EST（ncbi）或者array（。。这个不记得了，在ncbi上应该有别人的数据）的表达数据。

Ⅲ 如何运用生物信息学方法筛选mrna差异基因

1、使用寡核苷酸磁珠选择带有polyA尾的mRNA

2、构建cDNA 文库，测序
3、将测序reads比对到参考基因组
4、转录组重建
5、转录本表达定量
6、差异表达分析：edgeR、DEseq

Ⅳ 用生物信息学怎么分析一个基因的结构与功能

1,去NCBI上进行Blast，如果与已知的基因相同，可以直接点开它的基因简介，一般都会有该基因的结构功能说明。
2，如果与已知的序列有差异，就可以上EXpasy进行在线预测

Ⅳ 单个基因的生物信息学分析(1)-基因结构与功能分析

该分析工具的网址如下 FGENESH - HMM-based gene structure prediction

进入该网址之后，输入该基因的fasta序列，关于目标基因的fasta序列，fig.1即为所示，我们以小麦中的基因为例分析。

根据fig.2所示，将fasta序列输入进去，选择小麦（triticum aestivum），然后search。

图3展示了分析结果，可以看到我们这个序列比对到了正义链，因为我们用的例子是该基因的转录本，所以只包括黄色的部分，即CDSo序列，这也和我们使用的转录本相吻合。下面的是该基因对应的mRNA序列，同样也是1152bp，最下面的是将该mRNA翻译为蛋白质的序列。

同样选择好序列和物种，搜索，等待结果。

图5是分析结果，一共鉴定了10个基因，21个外显子，由于篇幅所限，我们只展示了前几个，但是统计的话，正好能对上数目。

图6是紧接上图的具体的序列分析，总共包含10个基因。

图8可以看到该基因在拟南芥中的同源基因，具体的生物学注释，就要看自己对这个基因的了解程度了。

Ⅵ 对一种疾病相关基因或其他感兴趣的基因进行生物信息学分析

光从基因表达谱找有异常表达的基因也不全面。做出来的基因表达谱往往有很多基因存在差异，有的可能是一些下游的免疫生物学反应，有的可能是误差或个体差异（尤其是做的数量少时），剩下的可能才有加以考虑的价值。
另外，有时疾病易感基因本身表达并无改变，而是通过调控其它基因发挥作用。所以，致病基因的寻找应从多种途径着手。
一孔之见，如有谬误之处，请大家指教。多谢verygood 兄，我的第一步可能只能做到表达谱的改变这一层次，如果有机会做下去的话，如你所言，应该从各种途径全面考虑。我现在的想法是以表达谱基因芯片技术为核心方法，做出患者和正常人小梁细胞基因表达谱的差异的总体信息，如maxon和你所说，这样可能找到新的致病相关基因，也可能不行，我想着起码是一个方面吧（不知对不对）。我目前所能考虑的是如何组织自己的思路，来吧这个工作做好。还有几个问题请教：
1.基因文库的建立方法中，比如有一篇文章中选了1118个基因进行研究，通过BLAST，分成了已知基因、已知序列、未知基因等几类，我不明白他们是如何从基因文库（提取细胞全mRNA逆转录来的)中选定的?(还是从别的地方查到的?)，我理解好像是直接测序，请问是如何从基因文库中找出（分离）这些基因一一测序的？
2.如何使用BLAST？比如同一文章中所说的已经测定出的1118个小梁细胞的表达谱基因序列我如何能查到？能给我讲解一下吗？太感谢了

有没有注意到一个问题,基因芯片只能检测已知的基因或序列,对于那些未知的则无能为力,一孔之见. Andrew说得不错，不过芯片中的基因数也在随对基因研究的深入而在不断增加。对普通的研究来说，主要的已知通路基本已能包括。多谢指教。有能回答我上面几个问题的吗？我还是有些不明白，看了一天资料也没有明白。
请问：如果我用一个正常群体的基因表达谱cDNA定做了一个芯片（含已知的1118个基因），在与患者cDNA样品的杂交中发现有一个基因表达下调了或者不表达，其原因是什么呢？是真的没有表达还是别的？
多谢多谢样本是否一致？比如血细胞，其细胞亚群是否有可比性？
有对照吗？样本是随机样本，小梁细胞是均一的内皮细胞。至于对照，你指的是阴性对照、阳性对照还是转录的内对照？
小弟所知甚少，低级错误也可能犯，请多多指教。除去实验和DNA芯片误差外，在与患者cDNA样品的杂交中发现有一个基因表达下调了或者不表达，需要用RT-PCR进行验证。其表达的下调或不表达，可能是受到其上游基因的调控，也可能是基因本身结构有改变，如无义突变可检测到表达的下降。对这些经RT-PCR证实后，应该进行测序，察看这些基因是否有结构的异常。在天天站长和各位战友的帮助下，我对现在所申请的课题从无知到略懂，终于完成了自然科学基金申请书的写作，在明天，我们的这份凝结着大家的汗水和智慧的申请书就要送出去之前，对各位这几天来的帮助表示诚挚的感谢，尽管这是我第一次写这样的申请，尽管几乎没有中的可能，我还是觉得自己学到了很多东西，也结识了很多好朋友，真诚的感谢给了我这个机会！
我把这份申请的正文部分放在了附件里了，希望感兴趣的朋友可以看一下，提一些宝贵意见，因为我认为这样的一个课题还是很值得去做的，尽管我们可能没有这个机会和能力去做。
再次感谢大家啦！

88411-.doc</A> (76.5k) 恭祝申请成功！！谢谢天天站长的指教，谢谢各位战友。
近日科研基金开始申报，老板急命申请课题。由于对基础刚刚接触，故请教站长以及各位战友。
1目前收集到一少见的单基因病（癫痫方面），在国内未见临床和基础报道。临床工作，包括留取血样已经完成。
2本病自从98年以来，致病基因得到了定位和克隆，但存在遗传异质性，相同的致病基因的突变位点也不相同。多篇文章发表在nature genetic等权威杂志上。最新的研究显示，仍有其他未知的致病基因。
3合作实验室，有曾经成功的定位和克隆了一例致病基因的经验。
我们申请的目的是致病基因的定位和克隆，并有望发现新的致病基因。
想请教各位：
1在目前仅仅掌握临床资料的情况下，能否提出申请？
2还需要做那一方面的工作？
2如果可以，可能申请失败的原因是什麽?

谢谢各位，急切盼望指教！谢谢如果是单基因疾病，那要看你收集的家系怎么样了。另一个问题主要是你的临床诊断正确与否。我不是临床的，这个临床诊断事关重大，如果有些是诊断错误或分型有误的，很有可能导致无法discover disease gene 单基因疾病这方面的技术策略已经很成熟，有很多文献可以参考。国内也有多家研究机构在做。我想研究下某个基因SNP与一种疾病的关联。国外已有报道在2个位点上有联系。那么我是进行RFLP分析，还是用SNP分析？各位大侠，我最近在做一个X染色体连锁遗传家系的疾病相关基因的定位，现在已用两个位点的MARKER(STR)做了基因组扫描，但是在连锁分析时遇到了困难，我用的是LINKAGE(version 5.1). 我想请教各位在进行连锁分析时，性连锁与常染色体连锁遗传参数设置有何不同？急盼各位予以赐教，不胜感激！答无事转转我想研究下某个基因SNP与一种疾病的关联。国外已有报道在2个位点上有联系。那么我是进行RFLP分析，还是用SNP分析？

RFLP是最早期的遗传标记(第一代)，随着遗传学的发展和测序片段的不断增多，已出现了第二代、第三代遗传标记。RFLP通过酶切作用进行分析，操作简单，花费不多，但特异性差，有被淘汰的趋势；SNP定位明确，相对花费较大，对其分析可以通过测序、小测序(Snapshot)、荧光探针、SNP芯片等方法。
具体行RFLP分析，还是用SNP分析看你的研究目标和经济实力。请教verygood，能否介绍一下小测序（snapshot）？

我最近想检测某基因与疾病的关系，外显子较多（20），在其他疾病中已有突变热点（9、11、13、17exon），但我要研究的病未见报道。请问我应对所有外显子测序吗？ coldant wrote:
请教verygood，能否介绍一下小测序（snapshot）？

我最近想检测某基因与疾病的关系，外显子较多（20），在其他疾病中已有突变热点（9、11、13、17exon），但我要研究的病未见报道。请问我应对所有外显子测序吗？

Snapshot为小测序反应，其原理简单地说是首先扩增包含SNP在内的一段DNA模板，再对PCR产物进行纯化，加入带有不同荧光的ddNTP和中间探针（所谓中间探针即SNP前20个bp左右寡核苷酸序列，探针与ddNTP按照模板序列结合，因为是ddNTP，其后不能再延伸，而结合的ddNTP反应的就是SNP情况），再纯化一下进行电泳，根据不同的荧光可以判断相应SNP基因型。
该方法适用于对已知SNP等位基因型进行确认，对探针要求不高；但操作步骤多，大规模应用较为困难（采用基于毛细管的测序方法，如ABI3100测序仪系列时，相对工作量小些）。
检测某基因与疾病的关系，外显子较多（20），在其他疾病中已有突变热点（9、11、13、17exon），建议你先研究一下这些位点。当然如果基因序列很短，也可以直接测序，因为目前发现的SNP或mutation毕竟还只有预计值的2%左右。
Good luck 谢谢verygood：）
最近忙着论文答辩的事情。我对于这方面完全是菜鸟，但是老板说要有新意，同学给出了个这样的主意。
目前已经提取DNA，进行基因分型。但是我希望测序进行确定。上面提到的SNAPSHOT是小型测序，我已经确定了突变位点，片段在300bp左右，是否可以全部测序？
另外是全部的样本测序还是就挑选几个杂合子和纯合子测就可以证明？这方面的资料在哪里有介绍？我还是新手：（无事转转 wrote:
谢谢verygood：）
最近忙着论文答辩的事情。我对于这方面完全是菜鸟，但是老板说要有新意，同学给出了个这样的主意。
目前已经提取DNA，进行基因分型。但是我希望测序进行确定。上面提到的SNAPSHOT是小型测序，我已经确定了突变位点，片段在300bp左右，是否可以全部测序？
另外是全部的样本测序还是就挑选几个杂合子和纯合子测就可以证明？这方面的资料在哪里有介绍？我还是新手：（

如果只是300bp，且标本不多的话，还是直接测序好，因为不仅可以明确已知的SNP基因型，还可能顺带发现一些文献未报道过的，这也就是说所有标本都要测序。
如果只想对已知的那些SNP进行基因分型，你可以采用SNAPSHOT方法，当然亦可以用RFLP，只是特异性差些，所得的条带不一定与目标SNP不同等位基因有关，可能切到染色体其他区域。
这方面到没有一定的资料，我们也是做过以后才逐渐理解的，具体采用何种技术还是因地制宜吧。 verygood wrote
检测某基因与疾病的关系，外显子较多（20），在其他疾病中已有突变热点（9、11、13、17exon），建议你先研究一下这些位点。当然如果基因序列很短，也可以直接测序，因为目前发现的SNP或mutation毕竟还只有预计值的2%左右。

谢谢verygood老师。我研究的基因编码区2930bp，mRNA5084bp，基因全长80kb。本打算直接测序，但病人组18例（石蜡），对照组20例（外周血DNA行吗？），费用可能要6万！！！，所以现在想改成PCR-SSCP加异常条带测序，您看行吗？ verygood wrote:

如果只是300bp，且标本不多的话，还是直接测序好，因为不仅可以明确已知的SNP基因型，还可能顺带发现一些文献未报道过的，这也就是说所有标本都要测序。
如果只想对已知的那些SNP进行基因分型，你可以采用SNAPSHOT方法，当然亦可以用RFLP，只是特异性差些，所得的条带不一定与目标SNP不同等位基因有关，可能切到染色体其他区域。
这方面到没有一定的资料，我们也是做过以后才逐渐理解的，具体采用何种技术还是因地制宜吧。

测序以后的结果要分析突变有什么软件检测呢？另外的统计学分析是不是有专门的生物统计学书有相关的介绍？还是就是普通的统计就可以了？ To coldant ：
对于初步研究，您的方法应该可行。

To 无事转转：
测序以后的结果分析突变主要通过序列比对初筛，可以利用Blast进行。不过确定是否确实为突变需要谨慎，应扩大样本再进行分型研究。作疾病相关研究，你的case 和control太少了。一般国内期刊好像也要200对200，国外一般性期刊需要400-500对500左右。一流的杂志一般都是至少1000对1000的。由于你经费不足，你不可能作测序，你还是直接选用已知的位点做。因为这个基因跟多种疾病相关，说明这个基因很保守，很有可能跟你所研究的疾病相关，就算没有相关，通过与年龄、性别、该疾病的危险因素综合分析（就是玩数字游戏），一般总能发文章的。
寻找疾病相关基因的SNP，目前主要是直接测序（外周血抽提的DNA，而不是组织），通过对比病人和正常人（无该疾病的人）该基因序列，搜寻SNP。verygood所说的blast，实际上并不适用。
你可对目标SNP所在区域设计一对prime1，使得该SNP位于其中,PCR长度500bp左右。同时在PRIMER1覆盖的区域内，再设计一对PRIMER2。PRIMER2其中一个引物的3‘最后一个碱基必需是与目标SNP所在位点的正常碱基互补，如此，若病人在此位点突变，将导致PRIMER2一对引物不能扩增。另外PRIMER2与PRIMER1至少相距100多bp,PRIMER2产物为200多BP。这样，在一个PCR反应中同时放入这2对引物，就可以得到4个片段（在设计引物时，必须使得这4个片段的长度不同，以便电泳时区别），而含有目标SNP的个体，则只有3个片段，通过电泳，就可以确定是否该个体有突变。
这个方法具体的名称我忘了。希望能对你有所帮组。 maxon wrote:
寻找疾病相关基因的SNP，目前主要是直接测序（外周血抽提的DNA，而不是组织），通过对比病人和正常人（无该疾病的人）该基因序列，搜寻SNP。verygood所说的blast，实际上并不适用。
你可对目标SNP所在区域设计一对prime1，使得该SNP位于其中,PCR长度500bp左右。同时在PRIMER1覆盖的区域内，再设计一对PRIMER2。PRIMER2其中一个引物的3‘最后一个碱基必需是与目标SNP所在位点的正常碱基互补，如此，若病人在此位点突变，将导致PRIMER2一对引物不能扩增。另外PRIMER2与PRIMER1至少相距100多bp,PRIMER2产物为200多BP。这样，在一个PCR反应中同时放入这2对引物，就可以得到4个片段（在设计引物时，必须使得这4个片段的长度不同，以便电泳时区别），而含有目标SNP的个体，则只有3个片段，通过电泳，就可以确定是否该个体有突变。
这个方法具体的名称我忘了。希望能对你有所帮组。

呵呵，我指的是借用blast来方便序列的比对，当然applied biosystems有更好的软件，不过您如未购买相应仪器则很难获得。
至于标本量的多少，确实是越多越好。对于相对危险度为2的致病位点来说，case-control各1000例检测效能才能达到100%，病例数减少则检测效能也随之降低。但对于初步研究，还不清楚该位点是否有研究疾病有关就大规模投入，有可能颗粒无收。
供参考。今天基康公司建议我直接测序，把样本4个一组形成一个“pool？”来测，节省经费。他们本来的建议是正常和病人各用4例分别形成1个“pool”来找SNP，然后用公司的TAG MAN（一种新技术）大规模检测SNP，但我没有这么多病人标本。所以只好只是测序。

请大侠看看这样好吗？如果我总共25例病人分成6个“pool”测序再分析可以吗？
先谢谢了。 maxon wrote:
寻找疾病相关基因的SNP，目前主要是直接测序（外周血抽提的DNA，而不是组织），通过对比病人和正常人（无该疾病的人）该基因序列，搜寻SNP。verygood所说的blast，实际上并不适用。
你可对目标SNP所在区域设计一对prime1，使得该SNP位于其中,PCR长度500bp左右。同时在PRIMER1覆盖的区域内，再设计一对PRIMER2。PRIMER2其中一个引物的3‘最后一个碱基必需是与目标SNP所在位点的正常碱基互补，如此，若病人在此位点突变，将导致PRIMER2一对引物不能扩增。另外PRIMER2与PRIMER1至少相距100多bp,PRIMER2产物为200多BP。这样，在一个PCR反应中同时放入这2对引物，就可以得到4个片段（在设计引物时，必须使得这4个片段的长度不同，以便电泳时区别），而含有目标SNP的个体，则只有3个片段，通过电泳，就可以确定是否该个体有突变。
这个方法具体的名称我忘了。希望能对你有所帮组。

呵呵，谢谢了。我在相关文献上看到的是设计2个引物（突变和未突变的），另外反义引物相同。正常对照组设计的引物很象你所谈到的PROMER2。我就纳闷为什么这样做？ verygood wrote:
To 无事转转：
测序以后的结果分析突变主要通过序列比对初筛，可以利用Blast进行。不过确定是否确实为突变需要谨慎，应扩大样本再进行分型研究。

确定是不可能做出结论，只是提出个展望。测序以后可以用SEQUENCEMAN软件分析，但是后面我想加个RFLP，按照相关文献报道来进行。这样分析起来好象就有更多的数据支持。 coldant wrote:
今天基康公司建议我直接测序，把样本4个一组形成一个“pool？”来测，节省经费。他们本来的建议是正常和病人各用4例分别形成1个“pool”来找SNP，然后用公司的TAG MAN（一种新技术）大规模检测SNP，但我没有这么多病人标本。所以只好只是测序。

请大侠看看这样好吗？如果我总共25例病人分成6个“pool”测序再分析可以吗？
先谢谢了。

呵呵，你也是在基康做吗？他们好象是用探针来检测SNP啊。我听说探针的准确性不如直接测序。不知道他们和你提出的是什么样的建议？：） maxon wrote:
作疾病相关研究，你的case 和control太少了。一般国内期刊好像也要200对200，国外一般性期刊需要400-500对500左右。一流的杂志一般都是至少1000对1000的。由于你经费不足，你不可能作测序，你还是直接选用已知的位点做。因为这个基因跟多种疾病相关，说明这个基因很保守，很有可能跟你所研究的疾病相关，就算没有相关，通过与年龄、性别、该疾病的危险因素综合分析（就是玩数字游戏），一般总能发文章的。

5555555，可是我收集不到这么多的病例呀，经费也有限。
您说的直接做已知位点是什么方法啊？另外您有看过《生物学统计》这样的书吗？听说参照它就可以进行相关的分析了。上海哪个图书馆或是书店有呀？具体什么方法我忘了。统计学主要就是T检验和X2 多态性分析方法有两大类：
其一，基于家系分析，主要采用连锁不平衡方法。
其二，基于case-control，如maxon所言，主要就是T检验和X2 。但是应注意control是否能代表所抽样的群体。因抽样错误而导致的假阳性结果在早期文献中比比皆是，这已逐渐引起大家的关注。无事转转wrote：
呵呵，你也是在基康做吗？他们好象是用探针来检测SNP啊。我听说探针的准确性不如直接测序。不知道他们和你提出的是什么样的建议？：）

看样子无事转转做的工作与我的很相似，可以多多交流！
基康公司建议：病人与对照各25例（病人只收集到25例），4例一组形成一个“pool”，PCR扩增所以外显子，直接测序。（节省费用）
申能公司建议：对每个病人进行扩增，直接测序，与genbank比较（不设对照组，费用18000元/10例）
北京鼎国公司：PCR-SSCP，（正常，病人各25例）

请verygood，maxon，无事转转等战友们参谋参谋，哪个可行？
申请斑竹们帮助。 coldant wrote:
看样子无事转转做的工作与我的很相似，可以多多交流！
基康公司建议：病人与对照各25例（病人只收集到25例），4例一组形成一个“pool”，PCR扩增所以外显子，直接测序。（节省费用）
申能公司建议：对每个病人进行扩增，直接测序，与genbank比较（不设对照组，费用18000元/10例）
北京鼎国公司：PCR-SSCP，（正常，病人各25例）

请verygood，maxon，无事转转等战友们参谋参谋，哪个可行？
申请斑竹们帮助。

我病例30，对照12。人家的建议是直接测序。我想测序以后再做个RFLP，因为是要写论文，所以内容不可以少。

阅读全文

与如何使用生物信息学分析一个基因相关的资料

热点内容

word中化学式的数字怎么打出来发布：2023-08-31 22:06:02 浏览：705

乙酸乙酯化学式怎么算发布：2023-08-31 21:59:55 浏览：1372

沈阳初中的数学是什么版本的发布：2023-08-31 21:59:06 浏览：1318

华为手机家人共享如何查看地理位置发布：2023-08-31 21:53:00 浏览：1010

一氧化碳还原氧化铝化学方程式怎么配平发布：2023-08-31 21:52:13 浏览：848

数学c什么意思是什么意思是什么发布：2023-08-31 21:44:12 浏览：1371

中考初中地理如何补发布：2023-08-31 21:29:55 浏览：1260

360浏览器历史在哪里下载迅雷下载发布：2023-08-31 21:20:27 浏览：671

数学奥数卡怎么办发布：2023-08-31 21:18:51 浏览：1351

如何回答地理是什么发布：2023-08-31 21:14:54 浏览：989

win7如何删除电脑文件浏览历史发布：2023-08-31 21:11:42 浏览：1023

大学物理实验干什么用的到发布：2023-08-31 21:07:03 浏览：1449

二年级上册数学框框怎么填发布：2023-08-31 21:05:06 浏览：1659

西安瑞禧生物科技有限公司怎么样发布：2023-08-31 21:04:01 浏览：834

武大的分析化学怎么样发布：2023-08-31 21:03:06 浏览：1213

ige电化学发光偏高怎么办发布：2023-08-31 21:02:12 浏览：1301

学而思初中英语和语文怎么样发布：2023-08-31 20:59:29 浏览：1608

下列哪个水飞蓟素化学结构发布：2023-08-31 20:50:46 浏览：1388

化学理学哪些专业好发布：2023-08-31 20:46:41 浏览：1453

数学中的棱的意思是什么发布：2023-08-31 20:45:44 浏览：1017