You are on page 1of 42

Bioinformation Discovery Data to

Knowledge in Biology Pandjassarame


Kangueane
Visit to download the full and correct content document:
https://textbookfull.com/product/bioinformation-discovery-data-to-knowledge-in-biolog
y-pandjassarame-kangueane/
More products digital (pdf, epub, mobi) instant
download maybe you interests ...

Ecological informatics data management and knowledge


discovery Michener

https://textbookfull.com/product/ecological-informatics-data-
management-and-knowledge-discovery-michener/

Knowledge Discovery in Big Data from Astronomy and


Earth Observation: Astrogeoinformatics 1st Edition Petr
Skoda (Editor)

https://textbookfull.com/product/knowledge-discovery-in-big-data-
from-astronomy-and-earth-observation-astrogeoinformatics-1st-
edition-petr-skoda-editor/

The Essentials of Data Science Knowledge Discovery


Using R 1st Edition Graham J. Williams

https://textbookfull.com/product/the-essentials-of-data-science-
knowledge-discovery-using-r-1st-edition-graham-j-williams/

Advances in Knowledge Discovery and Management Volume 8


Bruno Pinaud

https://textbookfull.com/product/advances-in-knowledge-discovery-
and-management-volume-8-bruno-pinaud/
Foundations of Predictive Analytics (Chapman & Hall/Crc
Data Mining and Knowledge Discovery Series) 1st Edition
James Wu

https://textbookfull.com/product/foundations-of-predictive-
analytics-chapman-hall-crc-data-mining-and-knowledge-discovery-
series-1st-edition-james-wu/

Discovering Knowledge in data An Introduction to Data


Mining Second Edition Daniel T. Larose

https://textbookfull.com/product/discovering-knowledge-in-data-
an-introduction-to-data-mining-second-edition-daniel-t-larose/

Multi-Scale Approaches in Drug Discovery. From


Empirical Knowledge to In Silico Experiments and Back
Alejandro Speck-Planche (Eds.)

https://textbookfull.com/product/multi-scale-approaches-in-drug-
discovery-from-empirical-knowledge-to-in-silico-experiments-and-
back-alejandro-speck-planche-eds/

Big Data Analytics and Knowledge Discovery 20th


International Conference DaWaK 2018 Regensburg Germany
September 3 6 2018 Proceedings Carlos Ordonez

https://textbookfull.com/product/big-data-analytics-and-
knowledge-discovery-20th-international-conference-
dawak-2018-regensburg-germany-september-3-6-2018-proceedings-
carlos-ordonez/

Advances in Knowledge Discovery and Data Mining 23rd


Pacific Asia Conference PAKDD 2019 Macau China April 14
17 2019 Proceedings Part II Qiang Yang

https://textbookfull.com/product/advances-in-knowledge-discovery-
and-data-mining-23rd-pacific-asia-conference-pakdd-2019-macau-
china-april-14-17-2019-proceedings-part-ii-qiang-yang/
Pandjassarame Kangueane

Bioinformation
Discovery
Data to Knowledge in Biology
Second Edition
Bioinformation Discovery
Pandjassarame Kangueane

Bioinformation Discovery
Data to Knowledge in Biology

Second Edition
Pandjassarame Kangueane
Pondicherry, India

ISBN 978-3-319-95326-7    ISBN 978-3-319-95327-4 (eBook)


https://doi.org/10.1007/978-3-319-95327-4

Library of Congress Control Number: 2018949608

© Springer International Publishing AG, part of Springer Nature 2018


This work is subject to copyright. All rights are reserved by the Publisher, whether the whole or part of
the material is concerned, specifically the rights of translation, reprinting, reuse of illustrations, recitation,
broadcasting, reproduction on microfilms or in any other physical way, and transmission or information
storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar methodology
now known or hereafter developed.
The use of general descriptive names, registered names, trademarks, service marks, etc. in this publication
does not imply, even in the absence of a specific statement, that such names are exempt from the relevant
protective laws and regulations and therefore free for general use.
The publisher, the authors, and the editors are safe to assume that the advice and information in this book
are believed to be true and accurate at the date of publication. Neither the publisher nor the authors or the
editors give a warranty, express or implied, with respect to the material contained herein or for any errors
or omissions that may have been made. The publisher remains neutral with regard to jurisdictional claims
in published maps and institutional affiliations.

Printed on acid-free paper

This Springer imprint is published by the registered company Springer Nature Switzerland AG
The registered company address is: Gewerbestrasse 11, 6330 Cham, Switzerland
Dedicated to the creator of life on earth and
to humanity that ponders its universal
existence.
Preface

The purpose of the book titled Bioinformation Discovery: Data to Knowledge in


Biology is to illustrate the power of biological data in knowledge discovery. The
book consists of 10 chapters spanning approximately 200 pages. It describes bio-
logical data types and representations with examples for creating a workflow in
bioinformation discovery. The concepts in biological knowledge discovery from
data are illustrated using line diagrams. This book provides clarity to graduate stu-
dents entering research in biology to design experiments and to formulate
hypothesis.
The principles and concepts in biological knowledge discovery are used for the
identification of prevalent rules toward the development of prediction models.
Simulations of biological reactions using prediction models will further help in the
design of its components. Advanced topics in molecular evolution in the context of
cellular and molecular biology are addressed using bioinformation gleaned through
knowledge discovery from data. The salient features of the book are (1) bioinforma-
tion discovery as a new domain in biology, (2) biological data representation, (3)
biological dataset creation from databases, (4) biological knowledge extraction
from data, (5) examples of knowledge discovery, and (6) exercises for practice. The
exercise problems are designed to help students to expand their problem-solving
skills in bioinformation discovery.

Pondicherry, India Pandjassarame Kangueane

vii
Acknowledgments

I wish to express my sincere appreciation to all members of Biomedical Informatics


(P) Ltd. for many discussions on the subject of this book. I also thank all my col-
leagues (Dr. S. Subbiah, Dr. Meena Sakharkar, Dr. Venkatarajan Mathura, Dr.
P. Gautam, Dr. B. S. Lakshmi), associates (Dr. Tan Tin Wee, Dr. P. R. Kolatkar, Dr.
E. C. Ren), collaborators (Dr. Paul Shapshak, Dr. Francesco Chiappelli, Dr. Kannan
Gunasekaran), staffs (Ms. R. Kayathri, Ms. N. Dandona, Ms. C. Iti, Mr. Lee Pern
Chern), and students (Dr. Zhao Bing, Dr. Yu Yiting, Dr. Lei Li, Dr. Cui Zhanhua,
Ms. Lim Yun Ping, Dr. A. Mohanapriya, Dr. Sajitha Lulu, Dr. M. Jayanthi, Dr.
G. Sowmya, Dr. Abishek Suresh, Dr. V. Karthikraja, Ms. A. Vaishnavi, Ms.
G. Shamini, Ms. S. Anita, Ms. Ilakya, Mr. G. Kalaivani) in my professional life,
especially during 1993–2018 without whom this edition of the book would not have
been materialized. I would like to thank the authors of several bioinformatics tools,
techniques, and databases made available in the public domain through open access
and open source publishing models. I am also thankful to Ms. K. Uma and Ms.
C. Nilofer for help with the development of this book.

Pandjassarame Kangueane

ix
Contents

1 Bioinformatics for Bioinformation ����������������������������������������������������������   1


1.1 Bioinformatics�������������������������������������������������������������������������������������� 1
1.2 Bioinformatics-Related Terms�������������������������������������������������������������� 3
1.3 Some Journals Supporting Bioinformatics ������������������������������������������ 3
1.4 Bioinformatics in Drug Discovery�������������������������������������������������������� 4
1.5 Skills for Bioinformatics���������������������������������������������������������������������� 4
1.5.1 UNIX Commands for Bioinformation Discovery�������������������� 5
1.5.2 Mathematics of Bioinformatics������������������������������������������������ 5
1.6 Bioinformatics Warehousing in Drug Discovery���������������������������������� 5
1.7 Bioinformatics Components ���������������������������������������������������������������� 8
1.8 Bioinformation�������������������������������������������������������������������������������������� 9
1.9 Bioinformatics Variables���������������������������������������������������������������������� 9
1.10 Cell Constituents���������������������������������������������������������������������������������� 9
1.10.1 Nucleic Acids���������������������������������������������������������������������������� 11
1.10.2 Proteins ������������������������������������������������������������������������������������ 11
1.10.3 Classification of Amino Acids�������������������������������������������������� 11
1.11 Codon and Codon Usage Table������������������������������������������������������������ 11
1.12 Bioinformation Discovery�������������������������������������������������������������������� 12
1.13 Bioinformatics Principle ���������������������������������������������������������������������� 12
1.14 Bioinformatics Challenges�������������������������������������������������������������������� 13
1.15 Biological Data ������������������������������������������������������������������������������������ 13
1.16 Data Explosion�������������������������������������������������������������������������������������� 15
1.17 Sequence Data�������������������������������������������������������������������������������������� 16
1.18 Structure Data �������������������������������������������������������������������������������������� 16
1.19 Small Molecules������������������������������������������������������������������������������������ 18
1.20 Macromolecules������������������������������������������������������������������������������������ 18
1.21 SCOP Dataset���������������������������������������������������������������������������������������� 19
1.22 CATH Dataset �������������������������������������������������������������������������������������� 20
1.23 Functional Data������������������������������������������������������������������������������������ 20
1.24 Pathway Data���������������������������������������������������������������������������������������� 21
1.25 Bioinformatics Developments�������������������������������������������������������������� 23

xi
xii Contents

1.26 Discovery Environment������������������������������������������������������������������������ 23


1.27 Sequence, Structure Alignment,
and Evolutionary Inferences ���������������������������������������������������������������� 25
1.27.1 Sequence Alignment ���������������������������������������������������������������� 25
1.28 Molecular Modeling������������������������������������������������������������������������������ 26
1.28.1 Protein Modeling���������������������������������������������������������������������� 26
1.28.2 Methods of Protein Modeling �������������������������������������������������� 26
1.28.3 Popular Force Fields for Molecular Mechanics������������������������ 26
1.28.4 Prediction of Protein Structure������������������������������������������������� 27
1.28.5 Caveats on Homology Modeling���������������������������������������������� 28
1.29 Molecular Docking ������������������������������������������������������������������������������ 28
1.30 Phylogenetic Analysis�������������������������������������������������������������������������� 30
1.31 Exercises ���������������������������������������������������������������������������������������������� 31
2 Creating Datasets for Bioinformation������������������������������������������������������ 33
2.1 Datasets ������������������������������������������������������������������������������������������������ 33
2.2 HLA Binding Peptide Dataset�������������������������������������������������������������� 34
2.3 MHC-Peptide Structural Dataset���������������������������������������������������������� 35
2.4 Grouping of MHC-Peptide Structures�������������������������������������������������� 35
2.5 PDB Chain Identifier���������������������������������������������������������������������������� 38
2.6 Information Redundancy in Dataset ���������������������������������������������������� 38
2.7 Information from MHC-Peptide Data�������������������������������������������������� 43
2.8 Structural Parameters for MHC-Peptide Dataset Analysis ������������������ 44
2.9 Creation of Heterodimer and Homodimer Dataset ������������������������������ 45
2.10 Homodimer Folding Dataset���������������������������������������������������������������� 46
2.11 Intronless Genes Dataset���������������������������������������������������������������������� 61
2.12 Human Single Exon Gene (SEG) Dataset�������������������������������������������� 63
2.13 Intron Containing Genes Dataset���������������������������������������������������������� 65
2.14 Fusion Protein Dataset�������������������������������������������������������������������������� 66
2.15 Cholera Toxin Dataset�������������������������������������������������������������������������� 67
2.16 HIV-1 GP160 (GP120/GP40) Structures���������������������������������������������� 68
2.17 Biological Data to Knowledge�������������������������������������������������������������� 69
2.18 Exercises ���������������������������������������������������������������������������������������������� 72
References���������������������������������������������������������������������������������������������������� 72
3 Tools and Techniques�������������������������������������������������������������������������������� 75
3.1 ALIGN�������������������������������������������������������������������������������������������������� 75
3.2 BIMAS�������������������������������������������������������������������������������������������������� 75
3.3 BLAST�������������������������������������������������������������������������������������������������� 76
3.4 CLUSTALW ���������������������������������������������������������������������������������������� 78
3.5 DeCypher���������������������������������������������������������������������������������������������� 79
3.6 DEEP VIEW ���������������������������������������������������������������������������������������� 79
3.7 FASTA�������������������������������������������������������������������������������������������������� 79
3.8 INSIGHT II������������������������������������������������������������������������������������������ 80
3.9 GENSCAN�������������������������������������������������������������������������������������������� 81
3.10 GROMOS���������������������������������������������������������������������������������������������� 81
Contents xiii

3.11 HBPLUS ���������������������������������������������������������������������������������������������� 81


3.12 LALIGN/PLALIGN ���������������������������������������������������������������������������� 82
3.13 LIGPLOT���������������������������������������������������������������������������������������������� 83
3.14 LOOK �������������������������������������������������������������������������������������������������� 83
3.15 MODELLER���������������������������������������������������������������������������������������� 84
3.16 NACCESS�������������������������������������������������������������������������������������������� 84
3.17 PHYLIP������������������������������������������������������������������������������������������������ 86
3.18 PROTPARAM�������������������������������������������������������������������������������������� 86
3.19 PROTORP�������������������������������������������������������������������������������������������� 87
3.20 PSAP ���������������������������������������������������������������������������������������������������� 88
3.21 InterPro ������������������������������������������������������������������������������������������������ 88
3.22 PYMOL������������������������������������������������������������������������������������������������ 88
3.23 RASMOL���������������������������������������������������������������������������������������������� 89
3.24 ROSETTA Design�������������������������������������������������������������������������������� 89
3.25 SURFNET�������������������������������������������������������������������������������������������� 90
3.26 SYBYL ������������������������������������������������������������������������������������������������ 91
3.27 T-EPITOPE DESIGNER���������������������������������������������������������������������� 91
3.28 Exercises ���������������������������������������������������������������������������������������������� 92
References���������������������������������������������������������������������������������������������������� 93
4 Protein-Protein Interaction���������������������������������������������������������������������� 95
4.1 Protein Subunit Interaction ������������������������������������������������������������������ 95
4.2 Protein Dimer Datasets in Literature���������������������������������������������������� 96
4.3 Parameters in Subunit Interaction �������������������������������������������������������� 97
4.3.1 Hydrophobic Effect������������������������������������������������������������������ 97
4.3.2 Interface Size���������������������������������������������������������������������������� 99
4.3.3 Interface Residues������������������������������������������������������������������ 100
4.3.4 Interface H-Bonds������������������������������������������������������������������ 101
4.3.5 Interface Electrostatics������������������������������������������������������������ 103
4.3.6 Interface Sidechain-Sidechain Interaction������������������������������ 104
4.3.7 Interface Hot Spots ���������������������������������������������������������������� 104
4.4 Conclusion������������������������������������������������������������������������������������������ 105
4.5 Exercise���������������������������������������������������������������������������������������������� 105
References���������������������������������������������������������������������������������������������������� 106
5 Homodimer Folding and Binding������������������������������������������������������������ 107
5.1 Importance of Homodimers���������������������������������������������������������������� 107
5.2 Homodimer Folding���������������������������������������������������������������������������� 108
5.3 Homodimer Structures in Folding������������������������������������������������������ 109
5.4 Size, Interface Area, and Structure ���������������������������������������������������� 109
5.5 Interface to Total Residues������������������������������������������������������������������ 112
5.6 Large, Medium, Small Interfaces�������������������������������������������������������� 112
5.7 Folding and Binding Mechanism�������������������������������������������������������� 113
5.8 Concluding Remarks�������������������������������������������������������������������������� 114
5.9 Exercises �������������������������������������������������������������������������������������������� 115
References���������������������������������������������������������������������������������������������������� 115
xiv Contents

6 Fusion Proteins������������������������������������������������������������������������������������������ 117


6.1 Gene Fusion���������������������������������������������������������������������������������������� 117
6.2 Operons in Prokaryotes as Human Fusion Proteins���������������������������� 118
6.3 Multiple Functions in Fusion Proteins������������������������������������������������ 119
6.4 Alternative Splicing in Fusion Genes ������������������������������������������������ 120
6.5 Protein Subunit Interaction and Fusion Proteins�������������������������������� 121
6.6 Mechanism of Gene Fusion���������������������������������������������������������������� 121
6.7 Hypothesis of Gene Fusion���������������������������������������������������������������� 122
6.8 Structural Importance of Fusion Proteins ������������������������������������������ 122
6.8.1 Fusion Protein IGPS Function������������������������������������������������ 123
6.8.2 Fusion Protein IGPS Structure������������������������������������������������ 123
6.8.3 IGPS Sequence, Structure, and Properties������������������������������ 124
6.8.4 Interface Area in IGPS������������������������������������������������������������ 126
6.8.5 Gap Volume in IGPS�������������������������������������������������������������� 126
6.8.6 Radius of Gyration in IGPS���������������������������������������������������� 128
6.8.7 Structural Features of Fusion Protein IGPS���������������������������� 128
6.9 Exercises �������������������������������������������������������������������������������������������� 129
References���������������������������������������������������������������������������������������������������� 129
7 MHC Informatics to Peptide Vaccine Design������������������������������������������ 131
7.1 MHC Biology and Diversity �������������������������������������������������������������� 131
7.2 Promise of MHC in Medicine������������������������������������������������������������ 132
7.3 MHC Structure and Function�������������������������������������������������������������� 134
7.3.1 Class I MHC Structure and Function�������������������������������������� 135
7.3.2 Class II MHC Structure and Function������������������������������������ 138
7.4 MHC-Peptide Motifs�������������������������������������������������������������������������� 140
7.4.1 Class I MHC-Peptide Motifs�������������������������������������������������� 140
7.4.2 Class II MHC-Peptide Motifs ������������������������������������������������ 141
7.5 MHC-Peptide Binding������������������������������������������������������������������������ 141
7.6 MHC Polymorphism and Specificity�������������������������������������������������� 142
7.7 MHC-Peptide Complex in T-Cell-Mediated
Immune Response������������������������������������������������������������������������������ 143
7.8 MHC-Peptide Binding Predictions ���������������������������������������������������� 144
7.8.1 Data-Driven Methods�������������������������������������������������������������� 144
7.8.2 Molecular Modeling Methods������������������������������������������������ 145
7.8.3 Molecular Modeling Limitations�������������������������������������������� 147
7.9 Application of MHC-Peptide Prediction�������������������������������������������� 147
7.10 T-EPITOPE Designer�������������������������������������������������������������������������� 147
7.10.1 HLA-Peptide Binding and Its Prediction�������������������������������� 147
7.10.2 Available Prediction Servers �������������������������������������������������� 148
7.10.3 T-EPITOPE Designer�������������������������������������������������������������� 148
7.10.4 Model�������������������������������������������������������������������������������������� 149
7.10.5 User Interface�������������������������������������������������������������������������� 150
7.10.6 Input Data������������������������������������������������������������������������������� 150
7.10.7 Output Result�������������������������������������������������������������������������� 151
Contents xv

7.10.8 Note on T-EPITOPE �������������������������������������������������������������� 151


7.11 HLA Supertypes���������������������������������������������������������������������������������� 152
7.11.1 Grouping of HLA Alleles by Several
Research Groups �������������������������������������������������������������������� 153
7.11.2 Perplexing Issues with HLA Supertypes�������������������������������� 153
7.11.3 Structural Basis for HLA Supertypes ������������������������������������ 153
7.11.4 Predictive Grouping of HLA Supertypes�������������������������������� 155
7.11.5 Grouping Using Electrostatic Distribution Maps ������������������ 157
7.11.6 Remarks on HLA Supertypes ������������������������������������������������ 157
7.12 Exercises �������������������������������������������������������������������������������������������� 157
References���������������������������������������������������������������������������������������������������� 159
8 Cholera Toxin Analysis to Vaccine Design ���������������������������������������������� 163
8.1 Vibrio cholerae Serogroups���������������������������������������������������������������� 163
8.2 Cholera Vaccine Candidates���������������������������������������������������������������� 164
8.3 Cholera Toxin (CT)���������������������������������������������������������������������������� 164
8.4 Protein-Protein Interfaces in CT �������������������������������������������������������� 165
8.5 CT Mutations in Serogroups�������������������������������������������������������������� 167
8.6 Conclusion������������������������������������������������������������������������������������������ 168
8.7 Exercise���������������������������������������������������������������������������������������������� 168
References���������������������������������������������������������������������������������������������������� 169
9 HIV-1 GP160 (GP120/GP40) Trimer ENV Spike Protein���������������������� 173
9.1 HIV-1/AIDS Vaccine Trials���������������������������������������������������������������� 173
9.2 HIV-1 GP160 (GP120/GP40) Trimer ENV
Spike Protein Complex ���������������������������������������������������������������������� 174
9.3 Glycosylation of HIV-1 ENV Spike Protein Complex ���������������������� 177
9.4 Expression, Purification, and Characterization
of ENV Trimer������������������������������������������������������������������������������������ 178
9.5 Conclusion������������������������������������������������������������������������������������������ 179
9.6 Exercise���������������������������������������������������������������������������������������������� 179
References���������������������������������������������������������������������������������������������������� 180
10 Eukaryotic Genes, Functions, Genomes,
Design, and Evolution�������������������������������������������������������������������������������� 183
10.1 Eukaryotic Genes and Genomes ������������������������������������������������������ 183
10.2 SEGE������������������������������������������������������������������������������������������������ 185
10.3 Genome SEGE���������������������������������������������������������������������������������� 185
10.4 Human Single Exon Genes �������������������������������������������������������������� 186
10.5 U-Genome���������������������������������������������������������������������������������������� 188
10.6 ExInt�������������������������������������������������������������������������������������������������� 188
10.7 Alterative Splicing���������������������������������������������������������������������������� 189
10.8 Intron and Exon Content in Genomes���������������������������������������������� 190
10.9 Exon-Intron Length Patterns������������������������������������������������������������ 191
10.10 Intron Organization and Evolution �������������������������������������������������� 192
10.11 Conclusion���������������������������������������������������������������������������������������� 193
xvi Contents

10.12 Exercises ������������������������������������������������������������������������������������������ 194


References���������������������������������������������������������������������������������������������������� 194

Index�������������������������������������������������������������������������������������������������������������������� 197
List of Figures

Fig. 1.1 Relevance of bioinformatics in agriculture, healthcare,


and biotechnology���������������������������������������������������������������������������������� 2
Fig. 1.2 Evolution of bioinformatics and bioinformation������������������������������������ 2
Fig. 1.3 Drug discovery pipeline. IND investigational new drug,
NDA new drug application���������������������������������������������������������������������� 4
Fig. 1.4 Skills for bioinformatics ������������������������������������������������������������������������ 5
Fig. 1.5 Types of data distribution are shown������������������������������������������������������ 7
Fig. 1.6 Description of energy function and energy minimization
using first-order differentiation �������������������������������������������������������������� 7
Fig. 1.7 Illustration of regression analysis and determination
of Pearson correlation coefficient (r) as shown�������������������������������������� 8
Fig. 1.8 Data warehousing in a discovery environment �������������������������������������� 8
Fig. 1.9 Bioinformatics components�������������������������������������������������������������������� 9
Fig. 1.10 Biological knowledge discovery flowchart ������������������������������������������ 10
Fig. 1.11 Bioinformatics variables ���������������������������������������������������������������������� 10
Fig. 1.12 Bioinformatics principle ���������������������������������������������������������������������� 13
Fig. 1.13 Bioinformatics challenges�������������������������������������������������������������������� 14
Fig. 1.14 Biological database and their associations�������������������������������������������� 14
Fig. 1.15 Data exchange between NCBI (USA), EBI (Europe),
and CIB (Japan). Please refer to Table 1.4 for description
on NCBI, EBI, and CIB������������������������������������������������������������������������ 15
Fig. 1.16 Data explosion in biological domain���������������������������������������������������� 16
Fig. 1.17 Genetic data growth in GenBank���������������������������������������������������������� 17
Fig. 1.18 Divisions in GenBank. BCT bacteria, FUN functional,
HUM human, INV invertebrate, MAM mammals,
ORG organelle, PHG phage, PLN plant, PRI primate,
PRO prokaryote, ROD rodent, SYN synthetic, VRL viral,
VRT vertebrate, PAT patent, EST expressed
sequence tags, STS sequence-tagged sites, GSS genome

xvii
xviii List of Figures

survey sequences, HTG high-throughput genomic, HTC high-­


throughput cDNA, CON contigs���������������������������������������������������������� 17
Fig. 1.19 Structural and classifications���������������������������������������������������������������� 18
Fig. 1.20 Protein structure and its components���������������������������������������������������� 19
Fig. 1.21 SCOP classification and folds�������������������������������������������������������������� 20
Fig. 1.22 CATH and classification ���������������������������������������������������������������������� 21
Fig. 1.23 An example pathway (glucose metabolism) is shown. This
pathway consists of two sections (glycolysis and citric
acid cycle). Glucose, glucose-6-phosphate, pyruvate, lactate,
acetyl-co-A, citric acid, α-ketoglutarate, and oxaloacetate
are small molecule metabolites. In this example
pyruvate dehydrogenase is the catalyzing protein enzyme ������������������ 22
Fig. 1.24 Major bioinformatics development based on category ������������������������ 22
Fig. 1.25 Tools and concepts in bioinformatics��������������������������������������������������� 23
Fig. 1.26 Issues in a biological discovery environment �������������������������������������� 24
Fig. 1.27 Types of molecular interactions������������������������������������������������������������ 24
Fig. 1.28 Sequence and structure alignment relation ������������������������������������������ 25
Fig. 1.29 Illustration of sequence alignment by global
and local alignment is shown���������������������������������������������������������������� 26
Fig. 1.30 Protein modeling principles. Force field equation (top),
force field terms (middle), unfolded to folded (bottom) ���������������������� 27
Fig. 1.31 Protein structure prediction is illustrated. The steps involved
in the prediction of a protein structure are shown�������������������������������� 28
Fig. 1.32 Schematic diagram illustrating the docking of a small
molecule ligand to a protein target to produce a
target-ligand complex �������������������������������������������������������������������������� 29
Fig. 1.33 Structure of the target Candida rugosa lipase (CRL) is shown������������ 29
Fig. 1.34 Molecular docking of Candida rugosa lipase (CRL) with
the isomers of ibuprofen is shown. H-bonds formed
between S(+) ibuprofen and target stabilizes binding.
This is not true for R(−) ibuprofen with the docked target ������������������ 29
Fig. 1.35 Phylogenetic analysis. (a) Properties of phylogenetic trees.
Leaves (vertices) ­represent species or sequences compared.
Nodes (vertices) represent bifurcations, speciation events,
and hypothetical ancestor sequences. Branches (edges)
represent sequence diversity. Branch lengths represent
sequence variation over time and rate of change.
The root (vertice) represents the hypothetical ancestor.
(b) Relationships of apes and humans are shown
using a sample p­ hylogenetic tree���������������������������������������������������������� 30
Fig. 1.36 Different types of phylogenetic analysis methods are illustrated �������� 30
Fig. 2.1 Creating biological datasets for knowledge discovery.
PDB Protein Data Bank, DDBJ DNA Data Bank of Japan,
EMBL European Molecular Biology Laboratory,
RCSB Research Collaboration for Structural Biology ������������������������ 34
List of Figures xix

Fig. 2.2 MHC-peptide binding at the binding groove is shown ������������������������ 38


Fig. 2.3 An example heterodimer structure complex of succinyl
co-A synthetase (α) and succinyl
co-A synthetase (β) is shown���������������������������������������������������������������� 44
Fig. 2.4 Sequence alignment (using EMBOSS needle) between
succinyl co-A synthetase (α) and succinyl co-A synthetase
(β) is shown with percentage similarity and identity���������������������������� 44
Fig. 2.5 An example homodimer structure complex of
aspartate aminotransferase A and B subunits is shown������������������������ 45
Fig. 2.6 Sequence alignment (using EMBOSS needle) between
aspartate aminotransferase A and B subunits is shown
with percentage similarity and identity������������������������������������������������ 45
Fig. 2.7 Homodimer folding and binding mechanism is shown.
2S two state, 3SDI three state with dimer intermediate,
3SMI three state with monomer intermediate�������������������������������������� 46
Fig. 2.8 The gene structure of SEG and MEG is illustrated������������������������������ 61
Fig. 2.9 GenBank FEATURES and CDS annotation
(bottom horizontal arrow) for a
genomic DNA (top horizontal arrow) �������������������������������������������������� 63
Fig. 2.10 CDS annotation for direct, complement,
and partial intronless genes������������������������������������������������������������������ 64
Fig. 2.11 Different CDS representations for intron-containing
multiple exon genes in eukaryotes are illustrated �������������������������������� 65
Fig. 2.12 Fusion protein scenario for imidazole glycerol
phosphate synthetase (IGPS) in yeast and bacteria������������������������������ 66
Fig. 2.13 A structural model of a cholera toxin (CT) is shown.
CT is a hetero-hexameric complex (AB5) consisting
of CTA (cleaved into 194 residues A1 and 46 residues
A2) and CTB (103 residues) pentamer
with D, E, F, G, and H chains �������������������������������������������������������������� 67
Fig. 2.14 Creation of a dataset for CTA and CTB sequences from
GenBank. A sequence dataset of CTA and CTB was
derived from GenBank (release 177) using KEYWORD
search as illustrated in the flowchart. The KEYWORD search
“cholera toxin” resulted in 1257 hits. This set consists
of 27 CTA sequences, 165 CTB sequences according
to GenBank description and available annotations.
The remaining 1065 sequences with descriptions such
as secretion protein, cholera toxin transcriptional
activator, ADP-ribosylation factor, GNAS complex,
dopamine receptor, Pertussis toxin, Shiga-like toxin,
and the like are eliminated from the dataset. Thus,
a CT sequence dataset of 192 sequences consisting
of 27 CTA and 165 CTB was created. The CTA and CTB
sequences are included in the dataset as available in the
xx List of Figures

GenBank. The biased availability on the amount of CTA


and CTB sequences in GenBank is attributed to the likely
observation of frequent mutations in CTB�������������������������������������������� 68
Fig. 2.15 Superposition of electron microscopy (EM) structures
(PDB ID, 5FUU (4.19 Å resolution) and 5U1F
(6.8 Å resolution)) of HIV-1/GP160 (GP120/GP40) trimer
spike protein complex. This is a trimer of three
GP160 structures. Each GP160 is made of
cleaved GP120 and GP40. Thus, (GP120/GP40)3 forms
the viral spike protein complex. GP glycoprotein�������������������������������� 68
Fig. 2.16 Biological knowledge pipeline from data is illustrated������������������������ 69
Fig. 2.17 A graphical abstract of different datasets
described in this chapter������������������������������������������������������������������������ 69
Fig. 3.1 An example for global and local alignment
is illustrated using ALIGN�������������������������������������������������������������������� 76
Fig. 3.2 An example for BIMAS HLA-peptide-binding
prediction is shown ������������������������������������������������������������������������������ 77
Fig. 3.3 An example for BLAST analysis is shown������������������������������������������ 78
Fig. 3.4 An example for multiple sequence alignment is shown ���������������������� 78
Fig. 3.5 DeepView download page�������������������������������������������������������������������� 79
Fig. 3.6 FASTA download page ������������������������������������������������������������������������ 80
Fig. 3.7 An example for GENSCAN output is shown �������������������������������������� 81
Fig. 3.8 A schematic representation of a
hydrogen bond is illustrated������������������������������������������������������������������ 82
Fig. 3.9 Download page for HBPLUS �������������������������������������������������������������� 82
Fig. 3.10 An example of LALIGN/PLALIGN input/output�������������������������������� 83
Fig. 3.11 An example for inhibitor-enzyme interaction
is shown using LIGPLOT �������������������������������������������������������������������� 84
Fig. 3.12 Binding of HLA A*0201 with mHag
peptides HA-1H and HA-1R is modeled and shown
using the LOOK interface�������������������������������������������������������������������� 85
Fig. 3.13 The download page for MODELLER�������������������������������������������������� 85
Fig. 3.14 The download page for NACCESS������������������������������������������������������ 86
Fig. 3.15 The download page for PHYLIP is shown ������������������������������������������ 87
Fig. 3.16 An example of PROTPARAM input/output is shown�������������������������� 87
Fig. 3.17 The web interface for PSAP is shown�������������������������������������������������� 88
Fig. 3.18 An example input/output for InterPro is shown������������������������������������ 89
Fig. 3.19 Download page for PYMOL is shown�������������������������������������������������� 89
Fig. 3.20 Download page for RASMOL is shown ���������������������������������������������� 90
Fig. 3.21 The web interface for ROSETTA is shown������������������������������������������ 90
Fig. 3.22 The download page for SURFNET is shown���������������������������������������� 91
Fig. 3.23 An example of input/output for T-EPITOPE
designer is shown���������������������������������������������������������������������������������� 92
Fig. 4.1 Interface shape complementarity
between interacting subunits���������������������������������������������������������������� 96
Chapter 1
Bioinformatics for Bioinformation

Abstract This chapter introduces concepts in bioinformatics and describes its


application in agriculture, healthcare, and biotechnology. The principles and
­components of bioinformatics are discussed in detail. A sound knowledge on the
basic concepts in bioinformatics is the foundation for bioinformation discovery
from data. The significance of bioinformation discovery in defining targets for
developing drugs is discussed. The issues in a discovery environment under
­pharmaceutical or biotechnological research and development environment are
illustrated using block diagrams. The importance of biological data (sequence,
structure, and function) in discovery is highlighted. The chapter also contains
­sufficient exercise problems for practice.

Keywords Bioinformatics · Bioinformation · Concepts · Techniques · Tools ·


Databases · Drug discovery · Pipeline · Sequence · Structure · Model ·
Interactions · Design

1.1 Bioinformatics

The bioinformatics discipline evolved in the late twentieth century using concepts
and techniques from multiple other disciplines with a vision to study issues in b­ iology
by comparing observable phenotypes with molecular genetic data. This has immense
application and relevance in healthcare, agriculture, and biotechnology (Fig. 1.1).
The key here is data related to the molecular genetics of living cells and organisms
generated using advanced techniques and tools from engineering. Thus, the ­discipline
borrows concepts and techniques either directly or indirectly from other established
disciplines such as mathematics, physics, chemistry, zoology, ­ botany, genetics,
biochemistry, molecular biology, chemical engineering, biochemical reaction
­
­engineering, biotechnology, computer engineering, and information science.
The idea is to store, retrieve, curate, and use molecular genetics data in databases
for the simulation of molecular phenomena in cells and organisms by applying
mathematical models. It should be noted that data is generated by the analysis of
samples from living cells, tissues, organs, and organisms using techniques, ­methods,

© Springer International Publishing AG, part of Springer Nature 2018 1


P. Kangueane, Bioinformation Discovery,
https://doi.org/10.1007/978-3-319-95327-4_1
Another random document with
no related content on Scribd:
Kuka voi hillitä askeleitteni määräämättömän kiireen:
eteenpäin, eteenpäin! Hauta on edessä.

— Alistuminen on elämää: kukkasia nousee, -kalpeita,


unisia kukkia, jotka elävät sunnuntaisin hautakummuilla!

— En tiennyt sinun koskaan valehtelevan: eihän minulla


ollut kuin sinä. Sinä menit pois.

TOTUUS

Olen petetty ja myyty: ei totuutta ollutkaan.

Minä luulin: se piili jossain, minä etsin ja hain, ja ihmiset


minä kysymyksin kiedoin; joka päivä ja yö minä riensin kuin
haamu ihmeellinen.

Sinut kaukaa näin. Ja katsoin, miten tähdet satoivat sinun


silmies autuudesta.

Joku kuiskasi salaa mulle sanat nöyrät ja varovat: Käy


kiertotietä, ja lyhty ota käteesi matkalles!

Minä ryntäsin suoraan. Ja nuijaa minä heilutin rientäissäin;


oli ylläni leijonan talja ja nilkoissa kahleitten jäljet.

Läpi pimeän erämaan!

Kun ennätin silmies eteen, olin lopen uupunut: näin


kauhistuneena, kuinka oli silmäs vain raketit, jotka heittää
valtavat kaaret yli Jumalan pilvien. Ja sammuvat. Pimeyteen
koko taivas pakahtui.

Minä huudan erämaassa: ei totuutta olekaan!

VIATTOMAT KÄDET

Älä näytä käsiäsi.


En ole sen arvoinen:
ne on liian viattomat.
Pirun kautta vannon sen,

pirun mustan naaman kautta,


joka peilistä irvistää
ja merkkikielin vakuuttaa,
ett' vala voimaan jää,

vaikk' onkin syyllinen suuni


sen valhein lausunut,
sama ylen-syyllinen suuni,
mi on käsiäs suudellut.

Älä näytä käsiäsi.


En ole sen arvoinen:
ne on liian viattomat.
Pirun kautta vannon sen.
KAKSINAAMA

En, jumal'avita, voikaan minä sietää kauempaa. Tänä päivänä


purjeet nostan, saa jäädä Franskan maa,

ja Castor ja Pollux johtaa


saa toisia satamiin.
Jumal'avita, liian kauaks
minut pistit valjaisiin.

Tulin juhdaks ja kääpiöksi


sun armoas ruikuttain.
Saman arvoituksen aina
ma vastattavaks sain:

Sano, kippari, miksi lienee


kaksnaamainen Januksen pää?
Jumal avita, mistäs taisin
sen kumman selvittää.

Sinä toisia lemmit ja kuljit


mun kanssani vierekkäin.
Jumal'avita, ties sen, miksi
sun enkeliksi näin.

Ja pirun naamaa en nähnyt —


olis arvoitus selvinnyt
ihan itsestään. Ja toinen
olis kohtaloni nyt.

Mene toiselle, saakoon sinut


joku onnellinen mies.
Jumal'avita, nahjukseksi
minut painoi juhdan-ies.

Mua vihreä meri ilkkuu ja tuuli hohottaa… Jumal'avita,


purjeet nostan: saa jäädä Franskan maa!

NÄKKI

Tummat laineet puhuvat tummalle rannalle


sanoinlausumattomia sanoja ja kivet paljastavat viluiset
hampaansa.

Me näemme villejä kuvia: kai näkki karilla soittaa turhia


toiveitaan.

En tiedä, onko tämä viimeinen kerta,


kun seisot nojaten käteeni.
Olen kuullut:
En voi,
sinun huuliltasi,
valkeilta ja väsyneiltä.
Ja myrskyn läpi singahtaa viiltävä ääni,
kun näkki karilla soittaa
nyyhkyttäviä virsiään.
Tyhmä näkki.

Sinun tukkasi on vaalea, oi kuule, sinun silmäsi ovat kuin


ulappa. Ja minäkö katson niihin tänään viimeisen kerran?
Ja näkki painaa päänsä ja on kauan vaiti. Sen tuska on
äkkiä noussut minun sydämeeni.

VIIMEINEN LAULU.

Tämä on viimeinen lauluni sinulle: iankaikkisuus kulki ohitseni


kauhistavin siivenhavinoin. Maa järkkyi.

Sieluuni valahti räikeä ääni kaukaisesta maailmasta, joka


on tulisena pallona pudonnut avaruuteen kummallisen
sattumalta.

Käsivarsissani oli tosin hirveä väkevyys: minä olisin kyennyt


murskaamaan, minä olisin kyennyt luomaan. Mutta sittenkin
olin pieni poika, niin viattoman mitätön, sidottuna kapaloihin.

***

Oi sinun silmäsi, oi sinun silmäsi! Ensin riuduttavat kuin


pouta, sitten kylmät kuin hallayö!

Tuuli on tullut: se on pudottanut kukat sinun hiuksiltasi.


Lempeät sadut ovat juosseet katseestasi. Tukkasi raivoaa
autioitten kasvojesi yllä.

Niin minun väkevyyteni meni pois — en tiennyt varmasti,


oliko sitä koskaan ollut.

Minä vaivuin piestynä eteesi, kauhea armaani:


iankaikkisuus kulki pauhaten ohitseni, mitään ei ole enää,
mitään ei ole ollut.

KAUHUSILMÄ

Hän näki kaikki suuren kuolon hirmut. Masto taipui,


ja läpi sormein liukui kuumentunut köysi.
Nyt kumahdus. Nyt lieskameri. Laiva uppos.
Ja öljymeri ajelehti keltaisena.

Ja aukes pimeyden portit ruostesaranaiset.


Ja taivaanlaki paloi mustin amppelein.
Hän vaappui vetten pinnalla kuin harhaantunut höyhen.
Hän tarrautui kokkapuuhun kouristuksin.

Hän havaitsi sen ihmetellen: yli vetten pinnan


vois yhtä hyvin tulla sana pelastuksen,
ja yhtä hyvin, hätärummuin, mustaharjaisena
vois vyöryä, kuin hyökylaine, kuolema.

Ja raivoavin katsehin ja aivot läkähtyen


hän näki vuorokautten jonon vaeltavan:
yks seuras toista niinkuin musta paholaisten saatto.
Hän paleli ja odotteli ratkaisua.

Ja suuri, punertava joko-tahi-kauhusilmä


loi ulapalle jähmettyneen kajastuksen.

———
Ja kädet molemmat ja hampaat kiiluvat ja rautajalat
hän irti laski hymähtäen kokkapuusta.
Näin yksinkertaiset on ratkaisut. Ah, elämä on helppo.
Oi kasvinsisko, rukoilethan puolestani?

RAATIHUONEENKELLARISSA

Kadulla on väritöntä lunta. Ruumissaatto ajaa torin poikki, jota


raatihuoneen kello katsoo ehtoopäivätiimain-silmillänsä
huolestunein vanhanpiian katsein. Kirkon suuret malmikellot
huutaa väkevän- ja jäyhän-äänekkäinä. Ruumisvaunuin
peräistuimella nuokkuu musta, hämärtynyt vaari.

Kellarissa soittaa saksalainen virheellisin tempoin villin


laulun minulle ja tyttöhempukoille, jotka istuu sivupöydän
luona tirskusilmin kahviansa juoden. Tiedän, ettei tilanteeseen
sovi villi laulu eikä tirskusilmät. Yhtäkaikki.

Akkunasta näen ruumissaaton ylen


jäyhän marssin, mustan, hämärtyneen
vaarin nuokun, papin itsehurskaan
maitonaaman, lesken pullean ja tylyn
ilmeen — saattaa olla, murheen
kyntelemän —.
Yhtäkaikki. Elämä on roskaa. Kyllähän sen tietenkin voi
kestää tuohon loppuun asti, jolloin pääsee
silkkikangasvuorilliseen arkkuun. Suunnattoman tärkeätä on
vain, että kestää naurunkareet suussa, poutapilvi otsan
yläpuolla. Traagillisen näyttelijän osa lienee yhtäkaikki
koomillisin.

Jos on totta, niinkuin lienee totta, ett' on maailman


pohjaväri harmaa, ehkä mieluimminkin tumman harmaa, pari
purppuraista maalitäplää tekis taivaallisen vaikutuksen…

Niinkuin tässä maisemassa tekee kaunis, rohdinmekko


kukkastyttö, harmaan talon rappusilla seisoin, käsi ovenripaan
tarttumassa, viivytellen sisäänastumista, ruumissaaton
poistumista oottain: syli täynnä purppuraa ja kultaa, oranssia,
veriruskeata!

EPÄONNISTUNUT KYSYMYS

Metsä tuli äkkiä eläväksi: sadat keijukaiset, jotka entisaikoina


lumosivat niin monta ritaria rakastumaan kauniisiin hiuksiinsa
ja vihreään pukuunsa, ovat heränneet suureen kokoukseen.

Ne seisovat kahden puun välissä. Ja karvainen hiisi


saarnaa niille elämänkatsomusta.

Ne kuuntelevat aivan hiljaa kuin vanhukset — ajat ovat


kuluneet —. Niissä ei ole yhtään eloa. Niitten perhossiivillä on
hiukan kullankeltaista hometta.
Metsä on ympärillä täynnä kuiskailevia lehtiä,
myöhäissyksyn lehtiä, jotka valittavat.

Hiiden kielessä on outo kysymys: Kuka herätti meidät


tyhjyydestämme? Miksi hän herätti meidät tyhjyyteemme?

Ja sadat keijukaiset
ovat kuin puusta pudonneita.

Ja karvainen hiisi nauraa kylmin silmin


eikä vastaa.

Oi nuori tyttö, joka seisot kanssani lämpöisessä metsässä


hyvin onnellisena: miten tyhmän sadun kerroin sinulle.

KERJÄLÄINEN

»Kohtalo kipitti ohitsemme kohti hautausmaata.

Ojensin sääriäni, joitten rikkinäiset siteet olivat silkistä ja


muistuttivat siitä, kuinka kerran oli ollut, ja sanoin veljelleni,
sokealle: Tiedätkö, kenen laihat jalat painuivat hietaan?
Kohtalon.

Sillä on graatian kasvot, hymyiset,


kuin pyhän eetterin värinä.
Sillä on yöhiusten kohdalla, hautausmaan puolella
Haadeksen koiran naama.
Kohtalo kipitti ohitsemme,
ei huomannut meitä.

Sillä on vaakakuppi hyppysissä, ja kupissa kykkivät


kyynelhelmet, miljoonien orjien kyynelhelmet, jotka aina
löytään köykäisiksi, keskentippuneiksi.

Kohtalo kipitti ohitsemme, ei huomannut meitä.

Me nauroimme kaksin.»

LAULU KAIPUUSTA

Oli kuin olisi viritetty pitkiä urkupiippuja


taivaasta maahan.
Ja minä olin urkuri.

Minä päätin sydänyöllä soittaa taivaisille valloille ja maalle,


ja metsälle, ja kotkanpojille.

Kaipuu istui etelätaivaisella pieluksella, kuin hunnutettu


haareminainen, joka ei näytä kasvojaan. Sen takana oli
vaaleanpunainen ruskoituksen seinä Minä pyysin sitä
tulemaan luokseni, istumaan oikealle puolelleni, pianissimoa
soittamaan itse.

Ja me soitimme yhdessä, minä fortea, hän pianissimoa, ja


ilman täytti sanomaton tuska.
Oli kuin minä olisin ollut tarpeeton mestari.
Minä vaikenin, hän soitti.

Ja metsät ja kotkanpojat, ne kuuntelivat paljain päin, ja


maan henget nyyhkyttivät pitäen toisiaan nytkähtelevästä
kaulasta.

UNI

Käy joskus, hyvin onnellisin hetkin, uni luokseni


ja lämpöisin ja omituisin uduin kätes peittää, äiti.

On silloin tupa outo ja niin kummallisen ihana.


Kaks väsynyttä, pientä poikaa vaipuu nukkumaan.

Soi hämylintu suvisella ehtoonurmikolla.


Sen ääni vaipuu punaisien marjatäpläin väliin.

Ja kettu mataa ilkkuvaisin silmin putkistossa.


Ja korppi nokkii juustoansa aivan valkeaa.

Ja prinsessa on kumartanut nuoren päänsä maahan:


hän etsii herneenjyviä ja tietä pakohon.

Vaan jättiläinen kauhistava nostaa väkinuijaa.


Ja minä olen kääpiö. Mä juoksen äidin luo.

PUNARINTAINEN LINTU
Jostakin kuului ääretön valitus. Tiimalasi oli valumassa
loppuun. Viimeinen jyvä vierähti äänettömästi ja
huomaamatta, niinkuin ei mitään olisi tapahtunut.

Esirippu halkesi. Kaikki, mikä näkyi, oli verhottuna mustalla


kankaalla.

Missään ei ollut valoa, joka on elämän ystävällinen katse.


Mieletön ääni huusi toistamiseen: Turhuuksien turhuus! Ilma
oli täynnä sokeita ajatuksia, jotka harhailivat päämäärättä.

Silloin sinä nauroit. Naurusi lensi kuin punarintainen lintu


synkän miilun keskeltä. Se liverteli ja istahti onnellisena
säikähtyneeseen rintaani.

Minun surullinen ajatukseni huikaistui kuin nahkasiipinen


lepakko äärettömän ihanasta valosta.

OLEN VIELÄ KAUKANA

Olen vielä kaukana.

Huomenna saavun. Hei, minun matkalaukkuni,


irvinaamainen reppuni, hei, ystäväni matkasauva: huomenna
me saavumme.
Ihan aikaisin.
Juuri kun ukko kirkonvartija aukaisee tapulin luukut.
Saunat, lauantaisaunat.
Piirileikkien rukkaslaulut
soivat kylässä.

Olen vielä kaukana. Hämärä, villi velhohämärä etsii notkoja,


kykkäitä, varjoja, haapasuppaita.

Lituskaiset kivet jalkojen alla, killisilmäiset kannot tien


poskessa, terve teille, terve, minä olen ylkämies, onnen
ylkämies. Ja niin hurjasti rakastunut.

MUODONVAIHDOS

En tiedä yhtään, kulkeeko minun pitkävartisissani eilinen


mies, mies, joka maantien laidassa virstantolpan alla aivan
masentuneena palvoi iankaikkisuutta.

En tiedä yhtään, hänkö sällinlakkini alla laulaa rentoja


lauluja. Ainakin hänet on kastettu uudestaan johonkin iloiseen
uskoon.

Ainakin on hänelle annettu uudet silmät, jotka näkevät


vihreätä ja punaista ja aamuruskon kaikki värit.

Ja uudet korvat, jotka kuulevat paljon salattuja ääniä:


ruisrääkän natkutuksen elopellossa hymyävänä aamuna.

Mutta maantietä hän astuu minun pitkävartisissani.


RANNALLA

Ihan pikkuisella kivellä, sormenmittaisella, asteli rantasipi


minua kohden ja kertoi minulle monta salaisuutta.

En nähnyt sen silmiä, sillä hämärä lauloi vakuvirttä. Näin


sen keikailevan nokan, kun se aukaisi sen sanoakseen hyvän
illan. Johon minä: Jumal' antakoon, liikutettuna, huovaten
tervaista venettäni.

Oi veljet,
se ehtoo levisi hyvänä
kuin mystillinen uhrilehto,
jossa on tammia,
jossa virvaliekit lämpöisinä tuohuksina palavat,
jossa ilma on hiukan raskas
horsman tuoksusta ja angervojen
ja suurien mustien kukkien,
joita ei ole kuin intialaisessa sadussa
ja kumminkin on.

Tsindalon, tsindalon.
Varmaankin kyntörastas.
Varmaankin on se sen posetiivarilta oppinut
tai suoraan Arnon rannalta
mustatukkaiselta, kaunisluomaiselta diivalta.
Hieno, varjostettu melodia.
Uskontunnustus.

Nuottikodan takaa:
Tsindalon.
ULLAKKOKAMARISSA

Luulen, että kaikki kummitukset tänä yönä laskettu on irti.

Ajatukset astuu permannolle niinkuin pikkulapset


hippapiiriin. Yksi käyskentelee keikistellen päässä irvinaama
narrinlakki.

Äkkiä se harppaa akkunasta jättäin tuijottamaan kaikki


toiset pitkänpyörein, hiukan tyhmin naamoin.

Ajatus käy vinttikaivon luokse sääskein syötäväksi


suvivaloon huoletonna istuin kannen päälle.

Joku piika avaa aitan oven pistäin lutinsolaan huivipäänsä,


sitten paljaat punertavat jalat. Piika laukkaa kaivon luokse
juomaan, sillä yö on helteinen ja raskas.

Lehtokurpan ääni koivun luota.


Lepakoitten hyrrät yllä aitain.

Piian nuori, värisevä sydän tuntee keskisuven oudot kutsut:


renki soittaa myllyahteen alla hanurilla tanssinrenkutuksen.
nostain hoikat käsivarret ilmaan kulkeissansa taasen
aitanluttiin.

Ajatus käy vinttikaivon luota.


Kiiltomatoin värilyhdyt syttyy.
Piha mahtaa odotella jotain.

Piippolakki-ajatus käy hiljaa,


laiskana ja ehkä murheellisna
kasteruohoin väliin pitkällensä.

JUHANNUSAAMU

Hei, kuule, huopaa lahteen! Me Kaukomieltä leikkien pois


ryöstämme Saaren neiden vesikivellä istuvan.

Oli pikkuniemessä tanssit:


ne soitti iloiten haitaria.
Nyt valkoliinaiset tytöt
vesikivillä vilkuttaa.

Ne istuu rivissä rinnan.


Ne on hiukan viluissansa jo.
Ne kärsivällisin silmin
tätä paattia odottaa.

Ne istuu rivissä rinnan


ja kurkoittuvat viileään
ja värisyttävään aamuun,
joka juuri kohoaa.

Ne kurkoittuvat päivään,
joka nauraa järven takana
ja kesyttömin käsin
joka ainutta syleilee.

Ja riutuvaiseen tuleen
lyö sauhu sinivälkkeinen.
Joku syksymielinen sälli
yhä soittaa haitaria.

VALLOITUSRETKI

Tänään vasta lähtivät kevään värisevät neitseet suurelle


valloitusretkelle puhaltaen ruokopilliä. Ne kengittivät itselleen
helmisandaalit ja ottivat etelätuulen hevoset. Huhuu, huhuu.

Ja naakat muistivat, että ne olivat vanhanaikaisia, ja


varpuset, ja ne häpesivät keskenään.

Ja neitseet ajoivat taisteluvaunuissa ja tulivat ikkunani alle


aivan orjanruusupensaan eteen.

Minä näin, miten lampaita laskettiin ulos, ja kuulin sonnin


haikean ämyrin. Ja renkipoika tallin ylisillä viritti ainoan
kultaisen laulunsa pienestä torpantytöstä ja palsamista
ikkunalla… Ne pidättivät etelätuulen hevosia ja puhalsivat
taikapilliä.

Hopeaiset laineet liplattivat vuoripurossa


ja menivät suoraan sydämeeni.

Kaunis neiti Margareeta,


tuletteko tanssiin tänään?

RIEMU
Ajattele, kuinka riemu kävi ylitseni kuin kirkastuksen pilvi.

Yksinäisellä suolla tuoksuivat pursut. Ja sadelinnun ääni,


yksitoikkoinen, onnellinen, sekaantui laineitten hentoon
pärskeeseen.

Kuin uni
valkoinen lokki
lensi poikki taivaan verkkokaton
minun ylitseni,
kun makasin aivan hiljaa ruohikossa
suon äyräällä, valoisan järven luona.

Ajattelin hetkisen lämmintä oloani. Sudenkorento,


järvensininen, heilahteli kuisman keltaisessa hatussa ja
katsoa tikitti minua hassun virallisena.

KURJET

Olenkohan ennen nähnyt, että kurkien auransakarat ovat kuin


häilyvä ajatus helteisten aivojen taivaalla. Katsohan, kuinka
yksi nopeana kuin onneton Ikarus vahasiivin epätoivoisesti
ponnistaen käy kärkeen.

Sen siivenlyönnit ovat tuulta tulvillaan.

Tänä valoisana päivänä, jolloin ystäväni poimi viimeiset


kypsät omenat vihreään koriin käsivarrelleen, me kuljimme
kauan pensasaitakujaa, joka on niin tuhatväriseksi tullut. Me
näimme kurkien kaihoisat aurat, kun ne lähtivät pois, me
kuulimme niitten sanomattoman tuskan. Emmekä me mitään
puhuneet.

Ehkä näimme, että siellä lensi viimeisenä räpyttelevä Eros,


ojennetussa kädessään viini, jossa ei ollut yhtään nuolta. Se
räpytteli ja oli pudota meidän puutarhanaidalle.

Mutta se meni kurkien jälkeen, viimeisenä. Sen vahasiipien


vitinän me kuulimme aivan kujan kohdalta, tuhkanharmaalta
taivaalta. Me katselimme toisiamme, ystäväni ja minä.

KEHRÄÄJÄT

Syksy käski harmaat tyttärensä, jotka nauttii vasta lapsi-ikää,


täksi yöksi kammioni loukkoon.

Miksi mietin sateenkaarisillat täältä sinne, missä armas


elää?

Syksyn neidet ottaa mustat kehrät, istuu ympärille


puolikehään, kehrää hämärissä unirihmaa keskenänsä hiljaa
kuiskutellen alinomaa, uupumukseen asti.

Yksi kehrää tuulen ullakolle inisemään, kuinka aika vierii.


Toinen kehrää pöllön kirkon ylle kuuluttamaan, että surma
kulkee.

Yksi kehrää vanhan pappi Krabben luokseni. Sen


kallosuussa hampaat nauraa mulle hurjan sameasti,
silmäkuoppain fosforiset läiskät lävistävät sydämeni seinät.

Yksi kehrää linnan valkeen rouvan: kellertävät hiukset


hulmahdellen paljaan paidan yllä juoksee rouva kuten ennen,
sata vuotta sitten sipsuttavin jaloin läpi huoneen, vaikka pappi
Krabbe tappoi hänet.

Jumi iskee hamaralla seinään.

MYLLYN LAKASSA

Mä punaisen myllyn lakassa ehtoolla istuen kuulen: kaikkialla


hiljainen soitto soi.

Näes: kirkon katolla täplä. Se on kuu, sappinen, kuollut kuu.


Ja naakkoja mustankarvaisia selässä torninkukon. Näes:
ainoa tornipöllö on noussut huhuamaan.

Mä istun myllyn lakassa ja pelkään niin. Täys pieniä jalkoja


mäki, lipojalkoja, käärmejalkoja. Käy tanssiin hautojen väki
vitiviitoissa, härmäkaavuissa. Ja kuolema kivisellä aidalla
tanssipilliä puhaltaa.

Ja punainen mylly kuin sääriluita jauhattaa.

You might also like