Command Mode EMBOSS 簡介及基本操作
|
|
Command mode EMBOSS 安裝於 Unix 主機裡,若使用者要利用 Command mode EMBOSS 分析序列,必須先登入主機,並以下指令之方式啟動程式,進行分析工作。常見 Unix 指令請參考 常用Unix指令表 網頁說明。
在使用 EMBOSS 時首先要注意的就是,因 Unix 主機和個人電腦的不同,而使用者若想使用EMBOSS 的程式來分析自己的序列時,首先就必須先以 Telnet 軟體建立個人電腦及主機間的連線,若需進行檔案傳輸時再以 FTP 軟體將個人的序列檔上傳或分析結果下載到個人電腦中進行列印,一些 command mode 常用工具請參考 常見軟體下載。 |
|
|
|
|
|
|
功 能 |
程 式 |
|
|
與EMBOSS主機連線 (Telnet) |
Netterm |
|
|
檔案傳輸 (FTP) |
WS-FTP、Cute FTP |
|
|
由螢幕上查看主機的分析結果圖形 |
Xwindow (Xwin32、Exceed) |
|
|
於個人電腦中觀看、修改或列印圖形 |
Internet Explorer, ACDSee, Photoshop等 (for png file)
GS-Tools、Corel Draw、PhotoShop (for ps file) |
|
|
|
|
|
|
|
|
|
|
注意事項: |
|
|
利用 ftp 軟體上傳或下載存放於自己電腦或 Server 中的序列檔案時,使用者必須注意序列檔案格式,純文字格式 (多命名為 .txt, .seq, .pep, .dat, .fasta, .list, .msf ...... 等附檔名) 以及 postscript (如 .ps 副檔名) 的檔案, 必須以 ascii 模式上傳和下載;若是圖片類 (如 .png, .gif...... ) 檔案,則必須以 binary 模式上傳及下載。 |
|
 |
Command mode EMBOSS 基本操作: |
|
 |
連線至EMBOSS主機: |
|
|
 |
> telnet bioinfo.nhri.org.tw (以 telnet 方式連上主機) |
|
 |
> login: xxxxxx (please enter your user account) |
|
 |
> password: yyyyyy (please enter your password) |
|
註: xxxxxx 為 user 申請 bioinfo.nhri.org.tw 的帳號,yyyyyy 為帳號的密碼。 |
|
 |
當使用者連接上主機之後,會出現 "Welcome to the WISCONSIN PACKAGE" 以及程式與各資料庫版本的說明,請不用擔心連接錯主機,因為國家衛生研究院已經將 Command mode GCG 和 Command mode EMBOSS 兩者整合在同一主機上,因此登入成功後不但可以使用 GCG,同時也可以使用EMBOSS,敬請放心。 |
|
|
 |
接著,只要輸入EMBOSS 的程式名稱,就可以開始進行序列分析工作了。如果對程式不了解,可以於程式名稱後加上 -help 之參數;若要讓程式依照各項步驟執行,則加上 -opt 的參數 (代表 option 之意) 即可。 |
|
|
|
如: > seqret -opt (執行 seqret 程式並依照各項步驟進行)
> wossname -help (查看 wossname 指令之說明) |
|
|
|
|
|
|
|
 |
使用範例 (以下黑色字為電腦敘述,紅色字為輸入的命令): |
|
 |
Command mode EMBOSS 使用的第一個程式-- wossname (列出與查看程式名稱) |
|
|
|
|
|
unix % wossname
Finds programs by keywords in their one-line documentation
Keyword to search for, or blank to list all programs: protein
SEARCH FOR 'PROTEIN' (*以下即為列出之結果)
antigenic Finds antigenic sites in proteins
backtranseq Back translate a protein sequence
charge Protein charge plot
...........................
topo Draws an image of a transmembrane protein
tranalign Align nucleic coding regions given the aligned proteins |
|
|
|
|
|
|
當結果出現之後,使用者就可以參考程式名稱後方的敘述,並選擇合適的程式使用。 |
 |
由EMBOSS讀入、輸出以及擷取序列-- seqret |
|
|
|
|
|
unix % seqret
Reads and writes (returns) a sequence
Input sequence: embl:xlrhodop (*此處輸入序列名,輸入 accession number 亦可)
Output sequence [xlrhodop.fasta]:
(*在此會先詢問 user 是否以此檔名輸出,同意按 enter 即可,也可自行輸入)
unix % more xlrhodop.fasta
>XLRHODOP L07770 Xenopus laevis rhodopsin mRNA, complete cds.
ggtagaacagcttcagttgggatcacaggcttctagggatcctttgggcaaaaaagaaac
acagaaggcattctttctatacaagaaaggactttatagagctgctaccatgaacggaac
............................... |
|
|
|
|
|
|
(*以 more 指令看 xlrhodop.fasta 序列內容)
|
|
 |
雙序列比對程式 -- dottup |
|
|
|
|
|
|
unix % dottup
DNA sequence dot plot
Input sequence: embl:xl23808 (*輸入第一條序列的名稱或序號)
Second sequence: embl:xlrhodop (*輸入第二條序列的名稱或序號)
Word size [10]: (*預設的 word size 為 10,可自行調整)
Display as data [N]: (*是否以 data 方式呈現,建議為 N )
Graph type [x11]: png (*檔案輸出之格式,建議鍵入 png 或 ps)
unix % ls
dottup.1.png dottup.ps |
|
|
|
|
|
|
(*以 ls 指令查看檔案,發現結果已經儲存為 .png 或 .ps 的檔案了,使用者需要利用 ftp 傳輸工具將檔案下載至自己電腦之中,才能夠顯示或修改)
|
|
Command mode EMBOSS 操作上並不困難。基本程式練習說明請按此處。此外,它還具有方便處理多筆序列資料的優點,因此當使用者有大量序列需分析時,不妨考慮使用 Command mode EMBOSS。
若對 Command mode EMBOSS 仍有疑問者,請參考原站 EMBOSS user documentation,
或參考 Introduction to sequence analysis using EMBOSS |