You are on page 1of 53

Intelligent Natural Language

Processing Trends and Applications


1st Edition Khaled Shaalan
Visit to download the full and correct content document:
https://textbookfull.com/product/intelligent-natural-language-processing-trends-and-ap
plications-1st-edition-khaled-shaalan/
More products digital (pdf, epub, mobi) instant
download maybe you interests ...

Natural Language Processing 1st Edition Jacob


Eisenstein

https://textbookfull.com/product/natural-language-processing-1st-
edition-jacob-eisenstein/

Python Natural Language Processing Advanced machine


learning and deep learning techniques for natural
language processing 1st Edition Jalaj Thanaki

https://textbookfull.com/product/python-natural-language-
processing-advanced-machine-learning-and-deep-learning-
techniques-for-natural-language-processing-1st-edition-jalaj-
thanaki/

Natural Language Processing and Computational


Linguistics 2 Semantics Discourse and Applications 1st
Edition Mohamed Zakaria Kurdi

https://textbookfull.com/product/natural-language-processing-and-
computational-linguistics-2-semantics-discourse-and-
applications-1st-edition-mohamed-zakaria-kurdi/

Applied Natural Language Processing with Python:


Implementing Machine Learning and Deep Learning
Algorithms for Natural Language Processing 1st Edition
Taweh Beysolow Ii
https://textbookfull.com/product/applied-natural-language-
processing-with-python-implementing-machine-learning-and-deep-
learning-algorithms-for-natural-language-processing-1st-edition-
Deep learning in natural language processing Deng

https://textbookfull.com/product/deep-learning-in-natural-
language-processing-deng/

COGNITIVE APPROACH TO NATURAL LANGUAGE PROCESSING 1


Edition Bernadette Sharp

https://textbookfull.com/product/cognitive-approach-to-natural-
language-processing-1st-edition-bernadette-sharp/

Natural Language Processing with Python Cookbook 1st


Edition Krishna Bhavsar

https://textbookfull.com/product/natural-language-processing-
with-python-cookbook-1st-edition-krishna-bhavsar/

Deep Learning in Natural Language Processing 1st


Edition Li Deng

https://textbookfull.com/product/deep-learning-in-natural-
language-processing-1st-edition-li-deng/

Natural Language Processing for Global and Local


Business 1st Edition Fatih Pinarbasi

https://textbookfull.com/product/natural-language-processing-for-
global-and-local-business-1st-edition-fatih-pinarbasi/
Studies in Computational Intelligence 740

Khaled Shaalan
Aboul Ella Hassanien
Fahmy Tolba Editors

Intelligent
Natural Language
Processing: Trends
and Applications
Studies in Computational Intelligence

Volume 740

Series editor
Janusz Kacprzyk, Polish Academy of Sciences, Warsaw, Poland
e-mail: kacprzyk@ibspan.waw.pl
The series “Studies in Computational Intelligence” (SCI) publishes new develop-
ments and advances in the various areas of computational intelligence—quickly and
with a high quality. The intent is to cover the theory, applications, and design
methods of computational intelligence, as embedded in the fields of engineering,
computer science, physics and life sciences, as well as the methodologies behind
them. The series contains monographs, lecture notes and edited volumes in
computational intelligence spanning the areas of neural networks, connectionist
systems, genetic algorithms, evolutionary computation, artificial intelligence,
cellular automata, self-organizing systems, soft computing, fuzzy systems, and
hybrid intelligent systems. Of particular value to both the contributors and the
readership are the short publication timeframe and the world-wide distribution,
which enable both wide and rapid dissemination of research output.

More information about this series at http://www.springer.com/series/7092


Khaled Shaalan ⋅ Aboul Ella Hassanien
Fahmy Tolba
Editors

Intelligent Natural Language


Processing: Trends
and Applications

123
Editors
Khaled Shaalan Fahmy Tolba
The British University in Dubai Faculty of Computers and Information
Dubai Ain Shams University
United Arab Emirates Cairo
Egypt
Aboul Ella Hassanien
Faculty of Computers and Information
Technology
Cairo University
Giza
Egypt

ISSN 1860-949X ISSN 1860-9503 (electronic)


Studies in Computational Intelligence
ISBN 978-3-319-67055-3 ISBN 978-3-319-67056-0 (eBook)
https://doi.org/10.1007/978-3-319-67056-0
Library of Congress Control Number: 2017951990

© Springer International Publishing AG 2018


This work is subject to copyright. All rights are reserved by the Publisher, whether the whole or part
of the material is concerned, specifically the rights of translation, reprinting, reuse of illustrations,
recitation, broadcasting, reproduction on microfilms or in any other physical way, and transmission
or information storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar
methodology now known or hereafter developed.
The use of general descriptive names, registered names, trademarks, service marks, etc. in this
publication does not imply, even in the absence of a specific statement, that such names are exempt from
the relevant protective laws and regulations and therefore free for general use.
The publisher, the authors and the editors are safe to assume that the advice and information in this
book are believed to be true and accurate at the date of publication. Neither the publisher nor the
authors or the editors give a warranty, express or implied, with respect to the material contained herein or
for any errors or omissions that may have been made. The publisher remains neutral with regard to
jurisdictional claims in published maps and institutional affiliations.

Printed on acid-free paper

This Springer imprint is published by Springer Nature


The registered company is Springer International Publishing AG
The registered company address is: Gewerbestrasse 11, 6330 Cham, Switzerland
Preface

New trends of Natural Language Processing systems are emerging. Applications


of these trends have been applied to various domains including education, travel
and tourism, health care, among others. Many issues encountered during the
development of these applications are resolved by incorporating language
technology solutions. The aim of the “Intelligent Natural Language Processing:
Trends and Applications” edited book is to bring scientists, researcher scholars,
practitioners, and students from academia and industry to present recent and
ongoing research activities about the recent advances, techniques, and applications
of Natural Language Processing systems and to allow the exchange of new ideas
and application experiences.
The edited book contains a selection of papers accepted for presentation and
discussion at The Special Track On Intelligent Language Processing: Trends and
Applications, International Conference on Advanced Intelligent Systems and
Informatics (AISI 2016). Also, an open call for book chapters was targeted to
researchers of the Computational Linguistics and Natural Language Processing
research Community.
This book is intended to present the state-of-the-art in research on natural
language processing, computational linguistics, applied Arabic linguistics and
related areas. We accepted 35 submissions. The accepted papers covered
the following eleven themes (parts): Character and Speech Recognition,
Morphological, Syntactic, and Semantic Processing, Information Extraction,
Information Retrieval and Question answering, Text Classification, Text Mining,
Text summarization, Sentiment Analysis, Machine translation, Building and
Evaluating Linguistic Resources, E-Learning. Each Submission is reviewed by the
editorial board. Evaluation criteria include correctness, originality, technical
strength, significance, quality of presentation, and interest and relevance to the book
scope. Chapters of this book provide a collection of high-quality research works
that address broad challenges in both theoretical and application aspects of
intelligent natural language processing and its applications.
The volumes of this book are published within Studies in Computational
Intelligence Series by Springer which has a high SJR impact. We acknowledge all

v
vi Preface

that contributed to the staging of this edited book (authors, committees, and
organizers). We deeply appreciate their involvement and support that was crucial
for the success of the “Intelligent Natural Language Processing: Trends and
Applications” edited book.

Dubai, United Arab Emirates Khaled Shaalan


Giza, Egypt Aboul Ella Hassanien
Cairo, Egypt Fahmy Tolba
Contents

Part I Sentiment Analysis


Using Deep Neural Networks for Extracting Sentiment Targets
in Arabic Tweets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Ayman El-Kilany, Amr Azzam and Samhaa R. El-Beltagy
Evaluation and Enrichment of Arabic Sentiment Analysis . . . . . . . . . . . 17
Sanjeera Siddiqui, Azza Abdel Monem and Khaled Shaalan
Hotel Arabic-Reviews Dataset Construction for Sentiment
Analysis Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Ashraf Elnagar, Yasmin S. Khalifa and Anas Einea
Using Twitter to Monitor Political Sentiment for Arabic Slang. . . . . . . . 53
Amal Mahmoud and Tarek Elghazaly
Estimating Time to Event of Future Events Based on Linguistic
Cues on Twitter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Ali Hürriyetoǧlu, Nelleke Oostdijk and Antal van den Bosch

Part II Machine Translation


Automatic Machine Translation for Arabic Tweets . . . . . . . . . . . . . . . . . 101
Fatma Mallek, Ngoc Tan Le and Fatiha Sadat
Developing a Transfer-Based System for Arabic
Dialects Translation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Salwa Hamada and Reham M. Marzouk
The Key Challenges for Arabic Machine Translation . . . . . . . . . . . . . . . 139
Manar Alkhatib and Khaled Shaalan

vii
viii Contents

Part III Information Extraction


Graph-Based Keyword Extraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
Omar Alqaryouti, Hassan Khwileh, Tarek Farouk, Ahmed Nabhan
and Khaled Shaalan
CasANER: Arabic Named Entity Recognition Tool . . . . . . . . . . . . . . . . . 173
Fatma Ben Mesmia, Kais Haddar, Nathalie Friburger and Denis Maurel
Semantic Relations Extraction and Ontology Learning
from Arabic Texts—A Survey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
Aya M. Al-Zoghby, Aya Elshiwi and Ahmed Atwan

Part IV Information Retrieval and Question Answering


A New Semantic Distance Measure for the VSM-Based Information
Retrieval Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
Aya M. Al-Zoghby
An Empirical Study of Documents Information
Retrieval Using DWT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
Mohamed Yehia Dahab, Mahmoud Kamel and Sara Alnofaie
A Review of the State of the Art in Hindi Question
Answering Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
Santosh Kumar Ray, Amir Ahmad and Khaled Shaalan

Part V Text Classification


Machine Learning Implementations in Arabic Text Classification . . . . . 295
Mohammed Elarnaoty and Ali Farghaly
Authorship and Time Attribution of Arabic Texts Using JGAAP. . . . . . 325
Patrick Juola, Jiří Milička and Petr Zemánek
Automatic Text Classification Using Neural Network
and Statistical Approaches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351
Tarek ElGhazaly

Part VI Text Mining


Using Text Mining Techniques for Extracting Information
from Research Articles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
Said A. Salloum, Mostafa Al-Emran, Azza Abdel Monem
and Khaled Shaalan
Text Mining and Analytics: A Case Study from News
Channels Posts on Facebook . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399
Chaker Mhamdi, Mostafa Al-Emran and Said A. Salloum
Contents ix

A Survey of Arabic Text Mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417


Said A. Salloum, Ahmad Qasim AlHamad, Mostafa Al-Emran
and Khaled Shaalan

Part VII Text Summarization


TALAA-ATSF: A Global Operation-Based Arabic Text
Summarization Framework . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435
Riadh Belkebir and Ahmed Guessoum
Multi-document Summarizer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461
Hazem Bakkar, Asma Al-Hamad and Mohammed Bakar

Part VIII Character and Speech Recognition


Features Extraction and On-line Recognition
of Isolated Arabic Characters . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481
Benbakreti Samir and Boukelif Aoued
A Call Center Agent Productivity Modeling Using Discriminative
Approaches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 501
Abdelrahman Ahmed, Yasser Hifny, Sergio Toral and Khaled Shaalan

Part IX Morphological, Syntactic, and Semantic Processing


Alserag: An Automatic Diacritization System for Arabic . . . . . . . . . . . . 523
Sameh Alansary
Learning Context-Integration in a Dependency Parser
for Natural Language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545
Amr Rekaby Salama and Wolfgang Menzel
Fast, Accurate, Multilingual Semantic Relatedness Measurement
Using Wikipedia Links . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571
Dante Degl’Innocenti, Dario De Nart, M. Helmy and C. Tasso
A Survey and Comparative Study of Arabic NLP Architectures . . . . . . 585
Younes Jaafar and Karim Bouzoubaa

Part X Building and Evaluating Linguistic Resources


Arabic Corpus Linguistics: Major Progress, but Still a Long
Way to Go . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613
Imad Zeroual and Abdelhak Lakhouaja
An Evaluation of the Morphological Analysis of Egyptian Arabic
TreeBank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637
Reham Marzouk and Seham El Kareh
x Contents

Building and Exploiting Domain-Specific Comparable


Corpora for Statistical Machine Translation. . . . . . . . . . . . . . . . . . . . . . . 659
Rahma Sellami, Fatiha Sadat and Lamia Hadrich Beluith
A Cross-Cultural Corpus Study of the Use of Hedging Markers
and Dogmatism in Postgraduate Writing of Native
and Non-native Speakers of English . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677
Rawy A. Thabet

Part XI E-learning
Intelligent Text Processing to Help Readers with Autism . . . . . . . . . . . . 713
Constantin Orăsan, Richard Evans and Ruslan Mitkov
Education and Knowledge Based Augmented Reality (AR) . . . . . . . . . . . 741
Salwa Hamada
A Tutorial on Information Retrieval Using Query Expansion . . . . . . . . . 761
Mohamed Yehia Dahab, Sara Alnofaie and Mahmoud Kamel
Part I
Sentiment Analysis
Using Deep Neural Networks
for Extracting Sentiment Targets
in Arabic Tweets

Ayman El-Kilany, Amr Azzam and Samhaa R. El-Beltagy

Abstract In this paper, we investigate the problem of recognizing entities which


are targeted by text sentiment in Arabic tweets. To do so, we train a bidirectional
LSTM deep neural network with conditional random fields as a classification layer
on top of the network to discover the features of this specific set of entities and
extract them from Arabic tweets. We’ve evaluated the network performance against
a baseline method which makes use of a regular named entity recognizer and a
sentiment analyzer. The deep neural network has shown a noticeable advantage in
extracting sentiment target entities from Arabic tweets.

Keywords Sentiment target recognition ⋅


Long short-term memory networks
Recurrent neural networks ⋅
Conditional random fields Arabic ⋅

1 Introduction

Sentiment target recognition is the task of identifying the subset of entities in a


piece of text which are targeted by the text’s overall sentiment. Sentiment target
recognition links between sentiment analysis and named entity recognition as it
seeks to recognize only entities which are the focus or the subject of a tweet’s
positive or negative sentiment.
The task we explore is formulated as follows: given some input text annotated
with either positive or negative sentiment, identify the entity in that text that is
targeted by the given sentiment. For example, in the following text: “So happy that

A. El-Kilany ⋅ A. Azzam
Faculty of Computers and Information, Cairo University, Giza 12613, Egypt
e-mail: a.elkilany@fci-cu.edu.eg
A. Azzam
e-mail: a.tarek@fci-cu.edu.eg
S.R. El-Beltagy (✉)
Center for Informatics Science, Nile University, Giza 12588, Egypt
e-mail: samhaa@computer.org

© Springer International Publishing AG 2018 3


K. Shaalan et al. (eds.), Intelligent Natural Language Processing:
Trends and Applications, Studies in Computational Intelligence 740,
https://doi.org/10.1007/978-3-319-67056-0_1
4 A. El-Kilany et al.

Kentucky lost to Tennessee!” there are two entities: ‘Kentucky’ and ‘Tennessee’.
The overall sentiment of this tweet is positive and as such the sentiment target
recognizer must identify the target of this positive sentiment which is “Tennessee”.
Sentiment target recognition in this setting is a specific case of a more general
framework which assumes that each entity in the text may have its own sentiment.
In this paper, we are proposing a solution to find targets of the overall text sentiment
rather than breaking down the text into multiple sentiments with multiple targets for
each sentiment. Such a setting allows us to tackle the sentiment target recognition
problem as a specific case of named-entity recognition.
In this paper, we propose two models for the sentiment target recognition task.
All our experiments are carried out on Arabic text. The first model, is a baseline one
which utilizes a named entity recognizer [1, 2] and a sentiment analyzer [3] to
recognize the target entities of some given text’s sentiment. The second model is a
deep neural network for named entity recognition which is provided with target
named entities in the training phase in order to identify them during the extraction
phase.
The deep neural network which we have used, consisted of a bidirectional
LSTM network [4] with a conditional random fields [5] classifier as a layer on top
of it. A word2vec model for Arabic words was built in order to represent the word
vectors in the network. The deep neural network model has shown a noticeable
advantage over the baseline model in detecting sentiment targets over a dataset of
Arabic tweets. Figures 1 and 2 depict the components of both baseline and deep
neural network models.
The rest of this paper is organized as follows: Sect. 2 provides a background
with respect to tasks that are related to sentiment target recognition; Sect. 3
describes the collection and annotation of Arabic tweets; Sect. 4 details the process
of building the word embeddings model while Sect. 5 describes both the baseline
model and the deep neural model; Sect. 6 presents the evaluation of the proposed
model through comparison of its performance against the baseline model while
Sect. 7 concludes this paper.

Fig. 1 Components of the baseline model


Using Deep Neural Networks for Extracting Sentiment Targets … 5

Fig. 2 Components of the deep neural network model

2 Background

The task of sentiment target recognition falls somewhere in between stance


detection, targeted sentiment analysis, and named entity recognition. While named
entity recognition seeks to find all entities in the text, targeted sentiment analysis
seeks to assign each entity or aspect of an entity in some given text, its relevant
sentiment which is highly dependent on the context in which it appeared. Stance
detection on the other hand, seeks to determine whether the author of some given
text, is pro or against some predefined ‘target’ which can be an entity or an issue.
Many models have been developed for each of the aforementioned tasks, but
recently the use of deep neural networks models in all of those tasks, has been
investigated as detailed here.
Long Short-term Memory Networks (LSTMs) [6] are a special type of recurrent
neural networks [7] which operate on sequential data. Given some input as a
sequence of vectors, an LSTM network should return a decision about each vector
in the sequence. LSTMs are designed to tackle dependencies in long sequences by
using a memory-cell to conserve the state of the operations on earlier vectors in the
sequence and prevent vectors from forgetting those through multiple iterations. In
[8, 4], Bidirectional LSTMs were trained for the tasks of named entity recognition,
part of speech tagging and chunking without the inclusion of any handcrafted
features. Word embeddings [9] and character embeddings [8] were used as the only
input representations for the sentence sequences in the LSTM network. Given the
bidirectional theme, each word representation vector was derived from its right
context and left context in order to present its state correctly. Recognizing named
6 A. El-Kilany et al.

entities with LSTM network was found to obtain state-of-the-art performance in


four different languages [8].
Detecting the polarity of aspects within English text, is another task for which a
multitude of systems were developed using deep neural approaches [10]. An
example of such as a system is presented in [11] where the authors used a deep
convolutional neural network to address the problem.
In [8], a conditional random fields (CRF) classifier was used on top of an LSTM
network in order to find the best tagged sequence of words and named entities for
an input sequence of words. The CRF classifier was used to model tagging deci-
sions jointly rather than predicating the tag for each word independently. A CRF
classifier was also used in [12] for the targeted sentiment analysis task in order to
extract each entity contained within some given text and assign it a sentiment value
using a set of handcrafted features for both named entities and sentiments.
Recurrent neural networks have also been used for the stance detection task. An
example is presented in [13] where a gated recurrent neural network is used to
identify the sentiment of some input text given a target. The target word as well as
its left context and its right context, are represented clearly in the network in order
to obtain a better classification for the sentiment related to this target.
Using a deep neural network to solve similar problems as those presented in [14]
has a clear advantage for discovering important features through the network’s
hidden layers. The automatic discovery of features provides the capability of dis-
covering a variety of hidden information within text without having to worry about
feature engineering.
In this work, we use a bidirectional LSTM to learn the features of sentiment
targets which are named entities, rather than learning the features of all named
entities. Tackling such a problem using a regular named entity recognizer would be
challenging as the handcrafted features of named entities and sentiment targets
aren’t expected to be different.

3 Data Collection and Annotation

When we embarked on the task of sentiment target recognition in Arabic tweets, we


discovered that no previous work has been carried out in this area. We therefore
decided that we need to build our own dataset. To create this dataset, we used a
previously collected set of tweets that had 480,000 entries. The dataset was col-
lected by searching the Twitter API using entries from the NileULex sentiment
lexicon [15]. Tweets from this dataset were randomly selected, annotated with
sentiment using the sentiment analyzer described in [3], and annotated with entities
using a modified version of the Named Entity Recognition system described in [1].
Tweets that were annotated as neutral or that had no entities were discarded. A total
of 12,897 tweets were generated this way. The number of generated tweets was
much more than the target we were aiming to annotate because we knew that some
Using Deep Neural Networks for Extracting Sentiment Targets … 7

tweets will be ambiguous, while others will have wrong entities. The next step
following the collection of this dataset, was revising and correcting the automati-
cally assigned labels, as well as specifying the sentiment target for each tweet. To
facilitate this process, a web based, user friendly application was developed. In
cases where the assigned sentiment was wrong or where the detected entity was
incorrect, the annotator was asked to correct it. The annotator was also asked to
specify the target entities for each tweet either by selecting from already identified
entities, or by manually entering the target entity.
The annotation process was carried out by a paid expert annotator. To ensure
that the resulting annotations would be of high quality, we periodically collected
random annotated samples and examined their correctness. The annotator was
aware that we were doing this and the agreement was that s/he will only get paid
after the annotation process was completed. This process resulted in the annotation
of over 5000 target entities.
We created a set of tags similar to those defined by the IOB format [8] which is
used for tagging sentiment targets and non-targets. The sentiment target recognition
tagging scheme only has three tags: B-target, I-target, O-tag, and aword is tagged
with B-target if it is the first word (beginning) of a target entity in a tweet. The
I-target tag is used when the target is made up of a sequence of words. While the
first word in such a case is tagged with the B-target tag, the remaining words in the
sequence are tagged with I-target tag. Any word which is not a target is tagged with
the O-tag. This dataset is available by request from any of the authors. It will also be
availed online.

4 Building Word Embeddings

One of the goals of this work was to experiment with a bidirectional Long
Short-Term Memory (BI-LSTM) neural network. Previous work for text related
tasks has shown that the performance of such networks is usually enhanced by the
use of word embeddings. Word embeddings [16] refer to a model for feature
learning used in NLP tasks to transform input words into a clustered representation
of real numbered vectors. The model results in the construction of low dimensional
vector representations for all words in a given input text corpus. Words sharing
common contexts in that corpus are transformed into vectors that are close to each
other in the vector space. As such, it can be stated that word embeddings produce an
expressive representation for words as it captures their semantics.
Using word embeddings within deep learning models for NLP tasks such
semantic parsing; named entity recognition and sentiment analysis has been shown
to result in a great performance boost. These tasks usually use a limited set of
labeled instances for training purposes. Word embeddings are usually constructed
from huge corpora, so it is very beneficial in these tasks to make use of pre-trained
word embeddings in order to have a generalized model with a reliable estimation
for the problem parameters.
8 A. El-Kilany et al.

For the English language, it is quite easy for researchers wishing to experiment
with word embeddings to use publicly available pre-trained embeddings. However,
for Arabic such embeddings do not exist, so we had to build our own. Training a
word embeddings model usually requires a large input corpus. The corpus that we
have used consisted of fifty four million Arabic tweets collected over the duration of
4 month (during 2015) by researchers at Nile University. In this work, we have
applied two word embeddings generation models to generate a vector for each
corpus word.
The first model was built using word2vec [16] which was trained using the
skip-n-gram model. Building the model involved a series of experiments which
involved using different settings and configurations. The tool used for building the
word2vec model was Gensim1 which is a widely used Python library for topic
modeling and other text related tasks. At the end, we used a model which was set to
produce a vector of length 100, and whose parameters were set to a window size of
5 and a minimum word frequency cut-off of 5. The advantage of using this method
is that it preserves the contextual similarity of words. Moreover, word2vec learns
the words order from the context of the large corpus of tweets.
The second applied embeddings model uses character-level embeddings which
derives a representation for every character, to create word embeddings. The model
that we have used is similar to the one presented in [8]. At the beginning, the
character embeddings are randomly initialized. After that character embeddings are
constructed by passing each character in every word in the sentiment target
recognition task dataset to a bidirectional LSTM from the forward and backward
directions. The embedding of each word is generated from the concatenation of the
bidirectional LSTM representation of the word characters. The advantage of
the character embeddings model is that it allows for building task specific
embeddings which are generated from the labeled training data. In addition, it is
capable of handling the out-of-vocabulary problem.

5 The Implemented Models

The goal of our work was to experiment with a bidirectional Long Short-Term
Memory (BI-LSTM) neural network for addressing the task of sentiment target
recognition. However, since this task has not been addressed before for Arabic, we
needed to provide another baseline model to which we can compare obtained
results. So in this paper, we present two different models for sentiment target
recognition in Arabic tweets. The first model is the baseline one, which relies on a
windowing method to detect target entities. The second model presents our pro-
posed approach which is a sequence tagging model based on a hybrid approach

1
https://pypi.python.org/pypi/gensim.
Using Deep Neural Networks for Extracting Sentiment Targets … 9

between a bidirectional Long Short-Term Memory (BI-LSTM) neural network and


a conditional random fields (CRF) classifier. Both models are detailed in the fol-
lowing subsections.

5.1 The Baseline Model

When building the baseline model, we followed a windowing approach which


detects sentiment targets based on the distance between each entity in the tweet and
sentiment words that appear in that tweet. In this model, input tweets pass through a
cleaning step to remove special characters and to normalize the tweet words for
consistent representation. The cleaned tweets are provided to a modified version of
the named entity recognizer described in [1] for detecting the named entities in each
tweet. The tweets are then passed to the El-Beltagy sentiment analyzer for tweet
sentiment identification and sentiment words detection [3]. For the latter task, the
sentiment analyzer produces two lists; one for the negative words in each tweet and
another for the positive ones. The implemented algorithm then selects the target
entity based on calculating the Euclidean distance between the generated entities
and the words present in the sentiment lists. The followed algorithm details are
shown in Fig. 3.

Fig. 3 Algorithm for the Window-based method for detecting sentiment targets
10 A. El-Kilany et al.

5.2 The Deep Neural Network Model

The proposed sentiment target recognition model is based on a hybrid sequence


tagging approach that combines a deep neural network (bidirectional-LSTM) with a
top layer consisting of a conditional random fields (CRF) classifier. The proposed
model follows a similar architecture to ones introduced in [4, 14] for different NLP
tasks such as named entity recognition and part of speech tagging. The proposed
bidirectional LSTM-CRF model architecture and how it was applied for the sen-
timent target recognition task is explained in the following subsections.

5.2.1 Bidirectional Long Short-Term Memory Networks (BI-LSTMs)

Recurrent Neural Networks (RNNs) [7] represent a class of neural networks that
have the ability of preserving historical information from previous states through
loops or iterations. These loops allow a RNN to represent information about
sequences as the RNN takes a sequence of vectors (x1, x2, …, xt) as an input and
produces another sequence (h1, h2, …, ht) as an output that represents information
about the input sequence over time t.
RNNs have been applied to a variety of tasks including speech recognition [17]
and image captioning [18]. RNNs have also been used for NLP tasks such as
language modeling, named entity recognition (NER) [8], and machine translation
[19]. However, RNNs suffer from the problem of long-term dependencies which
means that RNNs struggle to remember information for long periods of time and
that in practice a RNN is biased to recent input vectors in an input sequence.
An LSTM [6] is a special kind of RNN that is designed to solve the long-term
dependency problem through using several gates called the forget gates. Adding
these gates gives an LSTM the ability to control the flow of the information to the
cell state. The forget gates prevent the back propagated errors from vanishing or
exploding points through a sigmoid layer which determines which information to
remember and which to forget. In this research, we have used the following
implementation of LSTM:

it = σ ðWxi xt + Whi ht − 1 + Wci ct − 1 + bi Þ ð1Þ

ct = ð1 − it Þ ⊙ ct − 1 + it ⊙ tanhðWxc xt + Whc ht − 1 + bc Þ. ð2Þ

ot = σ ðWxo xt + Who ht − 1 + Wco ct − 1 + bo Þ. ð3Þ

ht = ot ⊙ tanhðct Þ. ð4Þ

where σ is the sigmoid function and ⊙ is dot product.


The bidirectional LSTM network that we have utilized consists of two distinct
LSTM networks. The first generates a representation for the left context of the
Using Deep Neural Networks for Extracting Sentiment Targets … 11

current word t while the second is responsible for providing the representation for
the right context through passing over the tweet in the reverse direction. Generally,
the first is called the forward LSTM and the latter is called the backward LSTM.
Each word in a bidirectional LSTM is represented through concatenating the output
of the forward and backward LSTM. The vector resulting from bidirectional LSTM
provides an effective representation for each word, as it takes context into con-
sideration in this representation.

5.2.2 The Conditional Random Fields (CRF) Tagging Model

Sentiment target recognition can be modeled as a binary classification problem


where each word/term in a tweet is either classified as a target or not. However,
such a model does not consider dependencies between word/terms in a sentence. As
natural language enforces grammatical constraints to build interpretable sentences,
it is challenging for a classification model to tag the words independently. For the
sentiment target recognition task, we take the relationship between words in a
sentence into consideration in order to construct a solid interpretation for the state of
every word. Towards this end, we’ve used conditional random fields.
The conditional random fields (CRF) model is a statistical based method which
can be applied in machine learning tasks that need structured prediction. A condi-
tional random fields model can tag words in a sentence either as a target or not-
while taking into consideration neighboring words that represent the context.

5.2.3 BI-LSTM-CRF

In this work, we have augmented a bidirectional LSTM with a CRF layer in


addition to a word embeddings layer to build and train a bidirectional LSTM-CRF
sequence tagging neural network for the sentiment target recognition task, where a
tag can denote either a target or a non-target word. Given tweet X of size n words
(x1, x2, …, xn), each word is represented as an m dimensional vector that is created
by the word embeddings layer. Specifically, in our model, the embedding vector for
each word in a tweet is obtained from the concatenation of the word2vec embed-
dings representation of the word and its character-level embeddings representation
which yields the weights of the first layer of our model. The bidirectional LSTM
layer uses the first layer weights in order to generate the features for the CRF layer.
The advantage of using a bidirectional LSTM is its capability to represent the
features to the right and left of the word for which the model is trying to predict a
tag (right and left contexts). The CRF layer receives these contextual features
extracted by the bidirectional LSTM to predict a tag for the current word based on
the previous and consequent word tags in the sentence. Figure 4 overviews the
interaction between the embeddings layer, the bidirectional LSTM layer and the
CRF layer to show an example of words in an Arabic tweet and their predicted tags.
12 A. El-Kilany et al.

Fig. 4 Overview of BI-LSTM-CRF model layers with an embeddings layer

For the proposed bidirectional LSTM-CRF sentiment target recognition model,


we define a set of annotations as follows: T: The number of distinct tags. C: A
transition matrix that represents the transition score from tag i to tag j calculated
from the training data where C is a square matrix of size T. L: A matrix that
represents the output score of the bidirectional LSTM where L is a matrix of size N
* T and where each word in the tweet has a score for each distinct tag.
For any input tweet X of size n words = (x1, x2, …, xn), the network is expected
predict a sequence of tags y = (y1, y2, …, yn). A matrix of scores of size N * T is
calculated for each word in the tweet. The score function is defined as the sum-
mation of both the output of C and L as follows:

N N
SðX, yÞ = ∑ Cyi, yi + 1 + ∑ Li, yi ð5Þ
i=0 i=1

A softmax function is applied to produce the probability for the tag sequence y:

eSðX, yÞ
PðyjX Þ = ∼
 ð6Þ
s X, y
∑y∼
∈ Yx
e

As Yx represents the set of all possible tag sequence predictions for a sentence
X, the objective function for the sentiment target recognition model during training
aims to maximize the log-probability of the correct tag sequence as follows:

logðPðyjX ÞÞ = SðX, yÞ − logadd ∼y ∈ Yx
SðX, y Þ ð7Þ

During prediction, the output sequence is chosen from the set of all possible
sequences that give the maximum score as follows:
 ∼
ypredicted = argmax ∼y ∈ Yx
s X, y ð8Þ
Using Deep Neural Networks for Extracting Sentiment Targets … 13

6 Performance Evaluation

The objective of our evaluation was to test our hypothesis that using a deep neural
network to discover a set of features for a challenging task such as sentiment target
recognition in a complex language like Arabic, can outperform a baseline solution
for the task.
Towards this goal, training and testing sets were derived from the annotated
Arabic tweets dataset previously described in data collection and annotation sec-
tion. From those, only 3000 were selected. Two thousands tweets were used for
building the training set while the rest (1000) were used for testing. Tweets in both
the training and testing sets were cleaned by removing all special characters. They
were also normalized as follows: “‫ “ﺇ‬,”‫”ﺃ‬, and “‫ ”ﺁ‬characters were replaced with “‫”ﺍ‬,
and “‫ ”ﻯ‬was replaced by “‫”ﻱ‬, while “‫ ”ﺓ‬was replaced by “‫”ﻩ‬
The sentiment target recognition tagging network with a bidirectional LSTM
augmented with a CRF layer described in the previous section was built by adapting
the implementation and network structure availed by the authors of [8] for tagging
named entities. Given the relatively small size of our training set, the network was
trained using 100 epochs in order to set the neuron weights.
To analyze the effect of the word2vec vectors on the results, the bidirectional
LSTM-CRF network was trained once with the word vectors from the word2vec
model concatenated with word vectors from the character embeddings model and once
with the word vectors from character embeddings model only. About 94% of words in
the training dataset had a vector representation in our set of word2vec embeddings.
Both our model and the previously described baseline method, aim at recog-
nizing sentiment targets in each Arabic tweet in the test set. The precision, recall
and F-score metrics were used to compare between the models. An annotated
sentiment target is considered to be detected by the model if any of its constituent
words is detected. Table 1 shows the scores for baseline method, bidirectional
LSTM-CRF with character embeddings only and bidirectional LSTM-CRF with
character embeddings and word2vec embeddings.
The results in Table 1 show the clear superiority of the bidirectional LSTM-CRF
network over the baseline method with respect to all metrics, especially when using
word embeddings. Handcrafting a set of features for sentiment target recognition is a
challenging task especially since most targets are simply a special case of a named
entity, but through training the bidirectional LSTM network, the network was able
to derive features that distinguish between sentiment target entities and other entities.
The results also show that both bidirectional LSTM-CRF networks (with and
without word embeddings) have achieved comparable precision, but the network

Table 1 Baseline and BI-LSTM models scores


Model Precision Recall F-score
Baseline method 0.449 0.519 0.4815
BI-LSTM-CRF with character embeddings only 0.732 0.615 0.668
BI-LSTM-CRF with character embeddings and word2vec 0.737 0.714 0.726
14 A. El-Kilany et al.

with the word2vec model has achieved a much higher recall. This means that the
bidirectional LSTM network with the word2vec model has discovered more target
entities from the tweets while conserving the same extraction precision. This
improvement achieved by the bidirectional LSTM-CRF network with the
word2vec model emphasizes the power of word embeddings for improving the
performance of NLP tasks.

7 Conclusion

This paper presented a model for detecting sentiment targets in Arabic tweets. The
main component of the model is a bidirectional LSTM deep neural network with a
conditional random fields (CRF) classification layer, and a word embeddings layer.
Results obtained by experimenting with the proposed model, show that the model is
capable of addressing the sentiment target recognition problem despite its inherent
challenges. The experiments also revealed that the use of a word2vec model
enhances the model’s results and contributes to the overall effectiveness of the
network in extracting sentiment targets. Comparing the proposed model against a
baseline method showed a considerable advantage in terms of results.

Acknowledgements We would like to thank Abu Bakr Soliman for building the user interface
used for annotating sentiment target data and for collecting the 54 million tweets that we have used
for building our word embeddings model. This work was partially supported by ITIDA grant
number [PRP]2015.R19.9.

References

1. Zayed, O., El-Beltagy, S.R.: Named entity recognition of persons’ names in Arabic tweets. In:
Proceedings of Recent Advances in Natural Language Processing (RANLP 2015), Hissar,
Bulgaria (2015)
2. Zayed, O., El-Beltagy, S.R.: A hybrid approach for extracting arabic persons’ names and
resolving their ambiguity from twitter. In: Métais, E. et al. (eds.) Proceedings of 19th
International Conference on Application of Natural Language to Information Systems
(NLDB2015), NLDB 2015, Lecture Notes in Computer Science (LNCS), Passau, Germany
(2015)
3. El-Beltagy, S.R., Khalil, T., Halaby, A., Hammad, M.H.: Combining lexical features and a
supervised learning approach for Arabic sentiment analysis. In: CICLing 2016, Konya,
Turkey (2016)
4. Huang, Z., Xu, W., Yu, K.: Bidirectional LSTM-CRF models for sequence tagging. arXiv:
1508.01991 (2015)
5. Lafferty, J., McCallum, A., Pereira, F.: Conditional random fields: probabilistic models for
segmenting and labeling sequence data. In: Proceedings of the Eighteenth International
Conference on Machine Learning, ICML, pp. 282–289 (2001)
6. Hochreiter, S., Schmidhuber, J.: Long short-term memory. Neural Comput. 9, 1735–1780
(1997)
Using Deep Neural Networks for Extracting Sentiment Targets … 15

7. Schuster, M., Paliwal, K.K.: Bidirectional recurrent neural networks. Trans. Sig. Proc. 45,
2673–2681 (1997)
8. Lample, G., Ballesteros, M., Subramanian, S., Kawakami, K., Dyer, C.: Neural architectures
for named entity recognition. In: Proceedings of NAACL-HLT (NAACL 2016) (2016)
9. Mikolov, T., Sutskever, I., Chen, K., Corrado, G., Dean, J.: Distributed representations of
words and phrases and their compositionality. In: Proceedings of the 26th International
Conference on Neural Information Processing Systems, pp. 3111–3119. Curran Associates
Inc., USA (2013)
10. Pontiki, M., Galanis, D., Papageorgiou, H., Androutsopoulos, I., Manandhar, S., AL-Smadi,
M., Al-Ayyoub, M., Zhao, Y., Qin, B., De Clercq, O., Hoste, V., Apidianaki, M., Tannier, X.,
Loukachevitch, N., Kotelnikov, E., Bel, N., Jiménez-Zafra, S.M., Eryi\ugit, G.:
SemEval-2016 task 5 : aspect based sentiment analysis. In: Proceedings of the 10th
International Workshop on Semantic Evaluation (SemEval-2016), pp. 19–30. Association for
Computational Linguistics (2016)
11. Khalil, T., Samhaa R. El-Beltagy: NileTMRG: Deep convolutional neural networks for aspect
category and sentiment extraction in SemEval-2016 Task 5. In: Proceedings of the 10th
International Workshop on Semantic Evaluation (SemEval 2016), San Diego, California,
USA (2016)
12. Mitchell, M., Aguilar, J., Wilson, T., Durme, B. Van: Open domain targeted sentiment. In:
Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing,
pp. 1643–1654 (2013)
13. Zhang, M., Zhang, Y., Vo, D.-T.: Gated neural networks for targeted sentiment analysis. In:
Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence, Phoenix, Arizona,
USA. Association for the Advancement of Artificial Intelligence (2016)
14. Collobert, R., Weston, J., Bottou, L., Karlen, M., Kavukcuoglu, K., Kuksa, P.: Natural
language processing (almost) from scratch. J. Mach. Learn. Res. 12, 2493–2537 (2011)
15. El-Beltagy, S.R.: NileULex: a phrase and word level sentiment Lexicon for Egyptian and
modern standard Arabic. In: Proceedings of LREC 2016, Portorož, Slovenia (2016)
16. Mikolov, T., Chen, K., Corrado, G., Dean, J.: Efficient estimation of word representations in
vector space. ICLR Work. (2013)
17. Sak, H., Senior, A.W., Beaufays, F.: Long short-term memory based recurrent neural network
architectures for large vocabulary speech recognition. CoRR. arXiv:1402.1128 (2014)
18. Mao, J., Xu, W., Yang, Y., Wang, J., Yuille, A.L.: Deep captioning with multimodal recurrent
neural networks (m-RNN). CoRR. arXiv:1412.6632 (2014)
19. Zhang, B., Xiong, D., Su, J.: Recurrent neural machine translation. CoRR. arXiv:1607.08725
(2016)
Evaluation and Enrichment of Arabic
Sentiment Analysis

Sanjeera Siddiqui, Azza Abdel Monem and Khaled Shaalan

Abstract This paper presents an innovative approach that explores the role of
lexicalization for Arabic sentiment analysis. Sentiment Analysis in Arabic is hin-
dered due to lack of resources, language in use with sentiment lexicons,
pre-processing of dataset as a must and major concern is repeatedly following same
approaches. One of the key solution found to resolve these problems include
applying the extension of lexicon to include more words not restricted to Modern
Standard Arabic. Secondly, avoiding pre-processing of dataset. Third, and the most
important one, is investigating the development of an Arabic Sentiment Analysis
system using a novel rule-based approach. This approach uses heuristics rules in a
manner that accurately classifies tweets as positive or negative. The manner in
which a series of abstraction occurs resulting in an end-to-end mechanism with
rule-based chaining approach. For each lexicon, this chain specifically follows a
chaining of rules, with appropriate positioning and prioritization of rules. Expensive
rules in terms of time and effort thus resulted in outstanding results. The results with
end-to-end rule chaining approach achieved 93.9% accuracy when tested on
baseline dataset and 85.6% accuracy on OCA, the second dataset. A further com-
parison with the baseline showed huge increase in accuracy by 23.85%.

Keywords Sentiment analysis ⋅


Opinion mining ⋅ Rule-based approach
Arabic natural language processing

S. Siddiqui (✉) ⋅ K. Shaalan


British University in Dubai, Block 11, 1st and 2nd Floor, Dubai International Academic City,
Dubai, UAE
e-mail: faizan.sanjeera@gmail.com
K. Shaalan
e-mail: khaled.shaalan@buid.ac.ae
A.A. Monem
Faculty of Computer and Information Sciences, Ain Shams University,
Abbassia, Cairo 11566, Egypt
e-mail: azza_monem@hotmail.com
K. Shaalan
School of Informatics, University of Edinburgh, Edinburgh, UK

© Springer International Publishing AG 2018 17


K. Shaalan et al. (eds.), Intelligent Natural Language Processing:
Trends and Applications, Studies in Computational Intelligence 740,
https://doi.org/10.1007/978-3-319-67056-0_2
18 S. Siddiqui et al.

1 Introduction

The mission of Sentiment Analysis is to perceive the content with suppositions and
mastermind them in a way complying with the extremity, which incorporates:
negative, positive or nonpartisan. Organization’s are taken to huge prestige by
living up to the opinions from different people [1, 2]. Subjectivity and Sentiment
Analysis characterization are prepared in four measurements: (1) subjectivity
arrangement, to estimate on Subjective or Objective, (2) Sentiment Analysis, to
anticipate on the extremity that could be negative, positive, or impartial, (3) the
level in view of record, sentence, word or expression order, and (4) the method-
ology that is tailed; it could be standard based, machine learning, or half breed [3].
As stated by Liu [4], Sentiment Analysis is “Sentiment analysis, also called opinion
mining, is the field of study that analyzes people’s opinions, sentiments, evalua-
tions, appraisals, attitudes, and emotions towards entities such as products, services,
organizations, individuals, issues, events, topics, and their attributes.”
Arabic is a Semitic dialect, which is distinctive as far as its history, structure,
diglossic nature and unpredictability Farghaly and Shaalan [5]. Arabic is broadly
talked by more than 300 million individuals. Arabic Natural Language Processing
(NLP) is testing and Arabic Sentiment Analysis is not a special case. Arabic is
exceptionally inflectional [6, 7] because of the fastens which incorporates relational
words and pronouns. Arabic morphology is intricate because of things and verbs
bringing about 10,000 root [8]. Arabic morphology has 120 examples. Beesley [8]
highlighted the hugeness of 5000 roots for Arabic morphology. No capitalization
makes Arabic named substance acknowledgment a troublesome mission [9]. Free
order of Arabic Language brings in additional challenges with regards to Sentiment
Analysis, as the words in the sentence can be swapped without changing the
structure and the meaning. Arabic Sentiment Analysis has been a gigantic center for
scientists [10].
The target of this study is to examine procedures that decide negative and
positive extremity of the information content. One of the critical result would be to
recognize the proposed end-to-end principle binding way to deal with other dic-
tionary based and machine learning-construct approaches in light of the chosen
dataset.
The rest of this paper is organized as follows. Related work is covered in Sect. 2,
Challenges to perform Arabic Sentiment Analysis is traced in Sect. 3, Data col-
lection is covered in Sect. 4 followed by system implementation in Sect. 5. Sec-
tion 6 covers evaluation and results, Sect. 7 depicts conclusion.
Evaluation and Enrichment of Arabic Sentiment Analysis 19

2 Related Work

To take a shot at Sentiment Analysis, the key parameter is the dataset. Late endeavors
by Farra et al. [11] outlined the significance of crowdsourcing as an extremely fruitful
technique for commenting on dataset. Sentiment corpora for Arabic brought into
existence to prove the methods and perform experiments [12–16].
One of the extreme need to perform sentiment analysis is the availability of
corpus. Few attempts are significant in literature illustrating the researchers zest to
fill in the barren land of Arabic datasets to perform Arabic Sentiment Analysis.
A freely available corpus brought into existence with the aid of manual approach by
Al-Kabi et al. [17] covered five areas that is—Religion, Economy, Sport, Tech-
nology and Food-Life style, with each of these areas covering 50 subjects.
Al-Kabi et al. [17] collected reviews from Yahoo Maktoob with constraints
including a clear discretion in the way the Arabic reviews written, with a mixture of
Eygptian, English, MSA and Levantine dialect. Unlike Al-Kabi et al. [17] who have
manually compiled the dataset, Farra et al. [18] used crowdsourcing to annotate
dataset. Apart from freely available corpus, there has been significant work on
different corpora but not shared openly to our knowledge. However some other
corpus worked on includes Financial—[19, 20]; News—[21–23].
Other than the corpus, the other main player in the whole process of Arabic
Sentiment Analysis is the Lexicon. Lexicons are the most desirable word list
playing a key role in defining the text polarity. The lexicons can be available with
the inclusion of adjectives. Adjectives are the best way to highlight polarity [24].
Few notable efforts found in literature where lexicons brought to life included,
business based lexicons by [25], SentiStrength [26].
Some of the exemplar additions to the Arabic Sentiment Analysis include
exploration on different methods in different domains however, piled up with
limitations. Likewise, the work by Mountassir et al. [27] on documents with 2,925
reviews in Modern Standard Arabic wherein no experiments performed to judge
their proposed method. With the news webpages and social reviews, Al-Kabi et al.
[28] worked at sentence level by dealing with colloquial Arabic with a limitation of
tiny dataset. However, Elarnaoty et al. [21] worked on document level with only
center on news publications.
Bolster Vector Machine classifier accomplished 72.6% precision on twitter
dataset of 1000 tweets [29]. The record level assessment investigation utilizing a
joined methodology comprising of a dictionary and Machine Learning approach
with K-Nearest Neighbors and Maximum Entropy on a blended area corpus
involving training, legislative issues and games achieved an F-measure of 80.29%
[30]. Shoukry and Refea [29] achieved a precision of 72.6% with the corpus based
method. The vocabulary and estimation examination device with an exactness of
70.05% on tweeter dataset also, 63.75% on Yahoo Maktoob dataset [12].
20 S. Siddiqui et al.

With a mixed approach that is Lexical and Support Vector Machine classifier
created 84.01% exactness [31]. 79.90% exactness was shown with Hybrid
methodology which involved lexical, entropy and K-closest neighbor [32]. Shoukry
and Rafea [33] independently sent two methodologies, one being Support Vector
Machine accomplished a precision of 78.80% and other one being Lexical with an
exactness of 75.50%.

3 Challenges Arabic Sentiment Analysis

In the first place the challenges with regards to sentiment analysis in Arabic
includes a principal that has a quick effect is subjectivity portrayal. In light of the
very truth of a trim distinction in a sentence being subjective or objective gets new
challenges. Various diverse challenges are found in Sentiment Analysis. If a neg-
ative presumption contains a segment from the positive vocabulary, it is general
explored as positive limit wherein it is negative. A word found as a section of both
positive and negative vocabularies obtains new challenges in the furthest point
undertaking. For example, “‫( ”ﺑﺎ ﻗﺮﻑ‬it makes me sick or disgusting) was found in
both negative and positive reviews; finally, joining positive and negative vocabu-
laries. A couple people create rude comments or unmistakable style of commenting
using negated sentences in a productive review thusly gets new troubles. For
example, “‫( ”ﺍﺣﺴﻦ ﻣﻦ ﻫﻴﻚ ﺭﺋﻴﺲ ﻭﺯﺭﺍﺀ ﻣﺎ ﻓﻲ‬There is no Prime Minister better than this
one).
As spoke to by Pang and Lee [34], positive words in one zone may hold a
substitute furthest point in another space. For example, a word like “‫( ”ﺑﺎﺭﺩ‬cold)
were found in positive and negative reviews holding specific limit. Distinctive
challenges joins, beyond what many would consider possible to 140 characters
people winds up using short structures, semantic mistakes in the tweets and
specifically usage of slang tongue [31]. Following are few challenges hindering the
natural language processing in Arabic.

3.1 Encoding

Windows CP-1256 and Unicode availability, one can read, compose and extract
substance written in Arabic. Issues do rise in the midst of the preparation work by
some different tasks, as needs be the use of transliteration where the Roman letters
and Arabic letters mapping are possible. Subsequently, keeping in mind the end
Another random document with
no related content on Scribd:
mystère du sien, mais nous eûmes bientôt la clef de l’énigme. A nos
complets taillés et vendus dans Cheapside, elles nous prenaient
pour des sujets de la reine Victoria, qui, comme l’on sait, raffolent
des primeurs.
Ce fut sous ce double et juvénile pilotage qu’après force tours et
détours dans des ruelles d’un quartier inconnu et malpropre, pavé de
cailloux dangereux et pointus, nous arrivâmes sans encombre au
port.

La scène ? Une estrade où l’on grimpe par quelques marches de


bois, quelquefois une chaise, un banc, un escabeau. Pas de rideaux,
pas de décors, pas même de rampe. La flamme qui jaillit des yeux
des chanteuses est préférable à tous les lustres ; garnissant le fond
sur une rangée de chaises, appuyées contre la muraille blanche,
elles forment le plus attrayant des décors. Tête nue, la chevelure
relevée très haut par un peigne gigantesque, le buste enveloppé
dans les plis d’un châle, en robe claire, elles bavardent, rient,
grignotent des pois chiches ou des olives, jouent de l’éventail,
fument des cigarettes, trempent le bout de leurs lèvres dans des
verres qu’on leur passe de la salle, interpellent à haute voix les
clients. Jolies ? Toutes ne le sont pas, mais toutes provocantes,
capiteuses comme ces vins de Val de Peñas qui grisent sans qu’on
s’en doute, si l’on s’approche trop souvent de la coupe.
Deux ou trois hommes sans âge, à menton glabre, portant le
costume andalou, veste noire très courte, pantalon serré aux reins
par une ceinture noire ou rouge, souliers vernis, tachent de leur
vulgarité cabotine l’étalage coloré des filles, et parmi eux
l’improvisateur à mine fine, descendant dégénéré des chevaliers
arabes, ancêtres de nos troubadours.
Au premier plan, le guitariste entonne doucement une ouverture ;
près de lui est une chaise destinée à la chanteuse en scène.
Les cantaoras chantent assises, à Madrid du moins. J’ai pensé
que c’est depuis l’interdiction des danses. La chanteuse debout,
entraînée par son sujet, céderait irrésistiblement au désir d’essayer
des jeux de hanches qui, pour être naturels, n’en offenseraient que
mieux les susceptibilités farouches de la police espagnole.
Une très gracieuse fillette de quinze à seize ans ouvre le
spectacle. Elle est blonde, du blond cher à Titien, avec un chignon
énorme sur le sommet de la tête. Des cheveux frisottants ramenés
soigneusement sur les tempes, et jusqu’au-dessous des oreilles, lui
cachent les côtés de la face. Elle rejette son châle bleu clair à
franges, étalant un corsage qui, en dépit de sa juvénilité, atteint de
très attrayantes dimensions.
Posant sans façon la main sur la cuisse du joueur de guitare, elle
promène un regard assuré sur l’assemblée, se recueille et lance tout
à coup une longue note ou plutôt une plainte prolongée d’une
grande douceur. Pendant une minute la guitare continue seule, puis
la chanteuse reprend sa note et commence sa romance, mélodie
sauvage, d’un charme infini.
Certes, les amateurs des Meyerbeer, des Wagner et autres
meurtriers de la vraie musique, comme on les a justement appelés,
priseraient médiocrement ces notes qui n’ont rien de commun avec
l’orchestration savante, si fort à la mode de nos jours. Moi qui
n’entends rien à toutes ces complications et qui, vrai barbare,
préfère une sonnerie de trompette ou même un vieil air de violoneux
à toute la cuistrerie artistique importée de l’Allemagne, je me suis
senti ému aux larmes à ces accents naturels qui me rappelaient les
naïves modulations des jeunes filles arabes dans les soirées
étoilées des oasis, des douars des grands plateaux du Tell, ou
encore celles des Mauresques, surprises au fond des vieux quartiers
d’Alger ou de Constantine.
Aussi simples que la musique sont les paroles :
« Mon amant m’a quittée comme un lâche, mon cœur plus lâche
encore l’appelait chaque nuit.
« Je me suis sauvée dans le désert pour y cacher mes larmes.
Mes yeux ont tant pleuré qu’ils ont fait pousser l’herbe.
« Tandis que la terre s’humectait et que l’espérance croissait
avec les tiges vertes — mon cœur se desséchait, et maintenant les
cailloux du chemin ne sont pas plus durs. »
Voici deux couplets d’une autre malagneña empreints de douceur
et de naïveté :

J’ai dans l’âme deux baisers


Qui ne me laissent pas vivre :
Le dernier de ma mère
Et le premier que je te donnerai.

Hélas ! ton amour est comme le taureau,


Où on l’appelle il va ;
Le mien est comme la pierre,
Où on le pose, il reste.

Le côté comique est que pendant la romance, chanteurs et


chanteuses continuent à bavarder ; puis, soudain, comme rappelés
au sentiment de la réalité et aux devoirs de la camaraderie, ils
interrompent l’artiste, éclatent en bravos, battent des mains, saisis
d’un enthousiasme indescriptible, et crient à tue-tête :
« Bien ! bien ! Vive la mère qui t’a mise au monde ! Heureux
l’homme qui se dit ton père ! Bien ! bien ! Ole ! ole ! »
Bien entendu, chacun ou chacune reçoit à son tour une
semblable ovation à laquelle le public ne participe pas toujours.
Vient une fille plus mûre, à l’œil superbe et sombre, aux gestes
félins et énergiques. Le sang arabe coule certainement dans ses
veines. Brune, maigre, nerveuse, c’est la vraie cavale de race,
infatigable et ardente. Sa voix sonne comme un clairon de combat…
des combats de Paphos.
Pendant qu’elle chante, les autres battent la mesure en frappant
bruyamment leurs mains, et le guitariste que les paroles
émoustillent, perdant sa gravité première, se dandine sur sa chaise
en roulant des yeux pâmés.
L’improvisateur lui succède. On l’appelle Surito ; il est, paraît-il,
en grande faveur dans Madrid, car on l’applaudit à outrance dès qu’il
remplace la cantaora.
Corps en avant, un coude sur les genoux, il tapote avec sa canne
le plancher, sans doute pour mettre ses idées en branle. La salle
entière est attentive ; les demoiselles de l’estrade cessent de
bavarder. Enfin, il lâche ses improvisations. C’est une succession de
quatrains ; la raison y manque quelquefois, mais la rime est, dit-on,
correcte.
Critiques des derniers actes politiques, épigrammes, apostrophes
aux clients, satires contre les généraux, les députés, les évêques,
les ministres, les toreros malheureux, tout se succède avec assez de
rapidité. Nombre de ces improvisations ont été sans nul doute
préparées à l’avance, mais la plupart sont forcément impromptues,
le poète travaillant sur commande et répondant par quatrains aux
interpellations variées des auditeurs.
Pour revenir aux chansons, un grand nombre, indépendamment
de leur rythme oriental, ont gardé une étrange physionomie biblique.
A côté de l’emphase espagnole, l’exagération arabe et l’incroyable
excentricité des images. C’est ainsi que, dans l’une des plus
populaires, un amant décrit les charmes de sa bien-aimée :
« Ton front est une place de guerre où l’amour victorieux a hissé
son étendard. — Tes yeux sont semblables à la lumière de l’aube,
dont l’éclat s’adoucit aux rayons de la lune. — Ton nez fin ressemble
à la lame d’une épée qui perce tous les cœurs. »
Un nez bien extraordinaire qui descend en droite ligne de celui
de la Sulamite, comparé par Salomon à la tour du mont Liban.
« Tu as un menton avec une fossette ; si l’on devait m’enterrer là,
je voudrais être mort… »
Image un peu risquée. Représentez-vous cette jeune fille portant
son amant enterré dans son menton. Comme singularité et mauvais
goût, voici un verset qui ne le cède en rien :
« Ta gorge est si belle et si claire, que ce que tu bois se voit au
travers. »
Et ce qui se mange aussi, sans doute. Je préfère le suivant, bien
qu’il soit un peu cruel :
« Tes bouts de seins ressemblent si bien à des cerises que j’ai
envie de les croquer quand j’y mords… »
Je me hâte de franchir les vers du milieu, beaucoup sont trop
légers pour qu’on s’y appuie, et saute au dernier :
« Tes pieds, ô jeune fille, foulent si fièrement la terre que partout
où tu passes, les roses fleurissent… »
Peut-être Maurepas s’inspira-t-il de ce passage lorsqu’il adressa
à Mme de Pompadour son fameux quatrain :

La marquise a bien des appas,


Ses traits sont vifs, ses grâces franches,
Et les fleurs naissent sous ses pas…
Mais, hélas ! ce sont des fleurs blanches.
XVII
A LOS TOROS !

Ville en fête ! Manolas et señoritas aux grands yeux, niñas et


muchachos, ganaderos et dueños, ouvriers et bourgeois, rudes
paysans et frêles citadins, à pied, à cheval, à mule, en voiture, en
charrette, en char, tous passent dans un tourbillon de poussière,
courant à la Plaza de toros.
C’est aujourd’hui dimanche. Le septième jour de la semaine n’est
pas pour l’Espagne le dies Domini, mais le dia de toros, car on s’y
occupe beaucoup plus de taureaux que du Seigneur.
A los toros ! A los toros ! Là seulement se réveille l’Hespérie
somnolente ; et dans cette époque d’effacement, d’engrisaillement et
de désolante uniformité, se revêtant de ses antiques splendeurs, elle
en offre à l’étranger le tableau vivant et encoloré, au milieu des
débris croulants du passé mort. « Et ce spectacle, disait Théophile
Gautier, est un des plus beaux que l’homme puisse imaginer. » Au
risque de heurter la sensiblerie de vieilles hystériques et de petites
bourgeoises et la sentimentalerie de quelques-uns de mes
compatriotes, j’avoue partager l’avis du maître.
Je conseille d’entrer quand l’amphithéâtre est presque garni.
Comme toutes les places sont numérotées et retenues à l’avance
par les billets achetés au despacho, il n’y a nul encombrement ;
personne ne prendra la vôtre, ou, si l’on s’en est emparé déjà, on
vous la rendra aussitôt avec des excuses.
Quels flots de lumière ! Quels ruissellements de couleurs ! Une
foule bigarrée est entassée par grappes de mille et de mille. Tous
ces éventails qui s’agitent, ces têtes qui remuent, ces chapeaux de
femmes, ces mantilles blanches et noires, ces parasols aux tons
variés forment avec les effets d’ombres et de clartés le plus curieux
coup d’œil.
Et quel plafond à ce théâtre : l’azur du firmament, et pour lustre le
soleil ! De celui-ci on ne cesse de se plaindre. Que calor ! Que calor !
Ces gens mériteraient de passer un hiver dans les brouillards de
Londres. Aussi les sombras, places à l’ombre, sont-elles chères,
elles valent jusqu’à deux et quatre pistoles, tandis que les autres
coûtent une peseta (un franc). Dans ces modestes je me rangeai.
Les grandes plaques humaines s’épaississent, s’étendent par
paquets multicolores ; les trouées vides diminuent et se comblent.
Çà et là, traversant l’arène, les valets du cirque, habillés de bleu
et de rouge, avec des bandes jaunes. On achève d’arroser le sable.
Des toreros passent rapidement, salués à grands cris par le
populaire qui les appelle par leurs noms :
« Manuel Ereria !
— Salvador Sanchez.
— Garcia ! »
Des marchands d’olives, d’oranges, de fleurs, de garbanzos,
circulent dans les gradins, et aussi de petites vendeuses d’eau,
criant d’une voix dolente : Agua fresca ! Agua fresquita ! Elles
tiennent l’alcarazas sur la hanche et n’ont qu’un verre pour tous les
assoiffés.
Des galeries supérieures, juste au-dessus de la porte du toril,
l’orchestre joue des peteneras. Les derniers arrivants débouchent
des vomitoires, gravissent à la hâte les gradins de pierre. Les taches
grises des dernières places restées vides se colorent de noir, de
rose, de bleu. Des châles, des mantilles, des capes pendant sur la
barrera, et partout, incessant, rapide, le grand frémissement
d’éventails. L’orchestre se tait et un air doux et prolongé de musette
sort de quelque coin de l’amphithéâtre.
La foule applaudit, des lazzi épicés se croisent en tous sens.
Mais l’heure sonne, la porte principale s’ouvre à deux battants, tous
se taisent : voici l’escadrille.
Rien de plus théâtral. En tête s’avancent les deux alguazils à
cheval dans des selles andalouses au large étrier maure. Leur
vêtement sévère fait d’autant plus ressortir les gaies couleurs du
reste de l’escouade. Coiffés de grands chapeaux à plumes
blanches, chaussés de bottes à l’écuyère, ils portent le justaucorps
et le petit manteau noir avec la collerette de dentelle du temps de
Henri IV. Puis trois par trois, retenant sur leur hanche gauche leur
cape de soie, marchent fièrement les matadors ou espadas, les
capadors et les banderilleros dans le costume du Figaro traditionnel,
chignon dans la résille, veste et culotte de satin vert, bleu, rose,
violet, rouge, surchargées de broderies d’argent ou d’or d’une
richesse inouïe.
Ces costumes, lorsqu’ils sont neufs, coûtent de 8 à 10 000 réaux
(2000 à 2500 francs), mais la plupart des toreros qui débutent les
achètent d’occasion pour un prix très inférieur. Suivent les picadors à
cheval, lance au poing, aussi dans la selle andalouse et dont le
costume diffère de celui des autres toreros par le pantalon et le
chapeau, et enfin, fermant la marche, l’attelage de mules
empanachées d’aigrettes et de houpettes rouges, destiné à
emporter les morts.
Ils font processionnellement le tour de l’arène et s’arrêtent devant
la loge de la municipalité. Un des alguazils reçoit de l’alcade la clef
du toril, enrubannée aux couleurs espagnoles, la jette à un valet de
l’amphithéâtre, puis tous deux sortent au galop.
On ouvre le toril. Moment solennel. Le taureau paraît dans un
éblouissement de lumière. Tous les yeux sont sur lui. Les
connaisseurs le jugent à la façon dont il se présente. Amené
pendant la nuit de la ganaderia au milieu de laquelle il paissait, il est
resté jusqu’à cette heure dans l’obscurité profonde et croit sans
doute voir s’ouvrir devant lui la grande prairie et la liberté. Mais au
moment où il sort du toril, on lui enfonce sur le cou, au-dessous des
cornes, par un hameçon de fer, une rosette aux couleurs de sa
ganaderia. Irrité, il va bondir au dehors, il s’arrête ahuri. Au lieu de la
plaine aux grands horizons, où depuis sa naissance il vivait en paix,
au lieu de son troupeau et de la source et de tous les objets
familiers, c’est l’inconnu, l’arène sablonneuse. Une montagne d’êtres
l’entoure, l’enserre, l’étouffe : vingt mille spectateurs avides de sa
stupeur et de sa colère. Ses yeux s’ensanglantent, il pousse un court
gémissement. Tout à coup, devant lui, à quinze pas, il voit des
couleurs brillantes ; des ennemis semblent le braver. Tête basse, il
se précipite. Comme une nuée d’oiseaux, les capadors s’envolent
par-dessus la barrière, et le taureau se heurte à une muraille de
bois. Mais déjà ses ennemis ont resauté dans l’arène, agitant devant
lui leurs capes. Il fond sur le plus proche, ses cornes ne traversent
que le vide. Il revient sur ses pas ; le voici entouré. A droite, à
gauche, devant, derrière, ce ne sont qu’étoffes qui s’agitent ; ébloui,
furieux, par ces couleurs flottantes et insaisissables, aveuglé par le
soleil, il continue à frapper dans le vide. Depuis deux minutes à
peine la course a commencé et sa rage est à son paroxysme. Alors
on lui offre les victimes.
Un picador monté sur un vieux cheval que la mort dans l’arène
sauve du couteau de l’équarrisseur, le pousse au taureau. On lui a
bandé un œil pour l’empêcher de voir son ennemi, mais il flaire
furieusement le danger et ce n’est qu’à coups d’éperon qu’il avance.
Toutes ces pauvres bêtes sentent bien qu’on les traîne à la mort. La
lance en arrêt, non pour se défendre, mais pour exciter le taureau,
car le fer très court pénètre le cuir à peine d’un centimètre, le picador
reçoit l’assaut formidable. Il n’est guère de situation plus déplaisante
et moins glorieuse ; il va sans pouvoir l’éviter à un horion certain.
Toute son adresse et ses efforts tendent à présenter son cheval aux
cornes, de façon à n’être point encorné lui-même. La bête frappée
s’abat, et fatalement il tombe avec elle, avec l’appréhension d’un
fâcheux inconnu : se rompre le cou sur la barrière, se casser un bras
ou une jambe, se fouler un poignet, être écrasé par le poids de sa
monture. L’attaque est, en effet, parfois si violente et la force telle,
que cheval et cavalier sont enlevés de terre, et dans la chute, le
picador doit encore songer à se garer d’un second assaut, se
servant de son mieux, comme bouclier, du corps du cheval. Les
valets le dégagent promptement en le soulevant par les aisselles,
dans l’impossibilité où il est de se remettre lui-même sur pied à
cause des cuissards qui encerclent ses jambes, et pendant ce temps
les capadors attirent ailleurs la rage du taureau.
Souvent le cheval est tué sur le coup, les cornes tout entières ont
plongé dans son ventre. Alors les valets le débrident, le dessellent et
le laissent dans l’arène. Quand il n’est que blessé, la blessure est
rapidement tamponnée d’étoupe, et le picador remis en selle va
l’offrir de nouveau au sacrifice. On voit arriver clopin-clopant un
cheval dont on vient de boucher une ou deux blessures. « Chat
échaudé craint l’eau froide. » Il n’y a pas lieu de s’étonner que
cheval encorné déjà deux fois redoute les coups de cornes. Aussi
refuse-t-il d’avancer, et l’éperon du picador devenu impuissant, deux
valets, armés de bâtons, le frappent par derrière. C’est le côté
ignoble des courses. Enfin, le taureau, d’un nouveau coup, termine
son agonie.
Souvent encore ses entrailles échappées par un ou deux trous
béants, traînent à terre, et toujours portant son cavalier, essayant, en
trébuchant, de fuir, il s’embarrasse les pieds dans ses intestins qui
se déroulent sanglants sur le sable. La pauvre bête n’a pas la force
d’atteindre l’écurie pour y mourir. Elle s’affaisse lourdement près de
la barrière, lève deux ou trois fois la tête comme pour protester
contre cette mort imméritée, jetant un reproche muet de son grand
œil triste ; puis la tête retombe, la queue crépite et bat faiblement le
sol. Quelques ruades et c’est fini ; elle a rendu au dieu injuste son
âme de cheval.
Il y a deux, trois, quelquefois quatre éventrements, et les corps
jonchent çà et là l’arène. On ne les enlève qu’à la fin de chaque
course ; or, comme la corrida comprend six ou sept taureaux, cela
fait une trentaine de chevaux tués ou blessés.
Massacres indispensables, dit-on. Outre qu’ils plaisent aux
instincts sanguinaires de la populace, ils servent à fatiguer le
taureau, épuisent une partie de sa fureur et de sa force, lui donnent
une luxation des épaules qui rend le jeu des capadors et des
banderilleros moins dangereux, et plus facile le coup final du
matador.
Le sacrifice des chevaux est le prélude nécessaire du drame,
c’en est la tierce partie. Cependant, en Portugal, les cornes sont
emboulonnées ; il n’y a donc pas d’éventrement. Mais les Espagnols
tiennent en profond mépris les corridas portugaises. Jeux d’enfants,
prétendent-ils. Pas de sang, partant pas de danger, et, sans danger,
ni gloire, ni émotion, ni plaisir.
Trois chevaux sont tués, deux blessés, le taureau haletant dresse
ses cornes sanglantes ; voici le tour des banderilleros.
Les banderilles sont des piques d’un pied et demi, dont la pointe
forme l’hameçon ; enfoncées dans le cuir, elles ne s’en détachent
plus. Une guirlande de papier doré et découpé en franges tourne
autour. Le banderillero, une dans chaque main, pointe en l’air, attend
l’animal ; aux capadors à le lui amener, et lorsqu’il se précipite, les
cornes à hauteur et à un pouce de ses flancs, d’un geste rapide il
plante les deux flèches au-dessus des épaules et pirouette
gracieusement sur ses talons.
La bête bondit en mugissant sous la double blessure ; elle se
secoue pour se débarrasser de ces fers qui la brûlent. Mais les
capes miroitantes viennent encore l’aveugler ; un deuxième, un
troisième banderillero, recommencent, un quatrième quelquefois, et
le taureau affolé court éperdu dans l’arène, avec six ou huit javelots
battant ses épaules déchirées.
Harcelé par les capadors, il essaye de frapper encore, fondant à
droite, à gauche, accrochant parfois un lambeau d’étoffe, sans
atteindre jamais l’insaisissable ennemi. Il s’arrête essoufflé. Ses
flancs se lèvent et s’abaissent comme un soufflet de forge ; il
regarde de tous côtés pour fuir et ne voit que le terrible cercle qui
l’enserre, la foule hurlante, et plus près les couleurs éclatantes de
ses ennemis.
Que faire ? Sa force est vaine, sa colère stérile. Pris de panique,
il tourne autour de l’arène. Une issue ? Pas une issue ! Cette course
du taureau en détresse est lamentable, et certes plus empoignante
que la mort des rosses éventrées. Enfin, fondant sur un ennemi qui
s’échappe encore ou franchit une barrière, il la franchit derrière lui.
Cette barrière, qui enferme l’arène, las tablas, haute d’environ six
pieds, est garnie d’un rebord en charpente qui sert aux toreros pour
sauter. On se trouve alors dans un couloir resserré entre las tablas
et une seconde barrière appelée barrera, élevée de plus de deux
mètres, bordure du premier gradin. Dans cette étroite piste tombe le
taureau. Il y tourne, harcelé par la foule lâche qui hurle et le frappe
de coups de canne, abritée derrière la barrera qu’il ne peut franchir.
On en a vu cependant escalader les gradins.
La Lidia, revue taurine, montre un taureau lâché dans les
escaliers et les vidant comme une trouée de mitraille. Le fait n’est
pas neuf, puisqu’une gravure de la Tauromaquia de Goya
représente un alcade embroché sur son estrade par un taureau
sauteur.
Après un trot dans le couloir, il trouve une porte ouverte et s’y
engouffre, et de nouveau le voici dans l’arène, de nouveau en face
de ses ennemis. La foule féroce le raille à grands cris.
Ahuri il regarde. Où sont ses grandes plaines aux horizons
bleus ? Que lui veut tout ce peuple ? Ah ! il y a dans son œil effaré
autre chose que des lueurs sanglantes.
Si les embryons confus des pensées se heurtent dans sa tête,
sous son épais crâne, il en est une qui domine toutes les autres,
l’instinct suprême de la conservation, la nécessité de fuir la mort, et il
franchit encore la barrière pour déboucher à nouveau, après des
huées et des coups, dans la fatale arène.
Alors fou, aveugle, il court, frappe au hasard, se débarrasse d’un
coup de corne, à mesure qu’il en rencontre, de ces capes qui flottent
devant ses yeux et l’affolent d’autant plus qu’il sent bien ne frapper
que l’air. Il est au point voulu ; il a reçu le nombre complet de
banderilles, il lui faut mourir. Sur un signe de l’alcade, un clairon
sonne la mort.
Du groupe des capadors et des banderilleros, le matador se
détache. C’est le roi de la fête. Grand, admirablement découplé,
souriant, confiant en son adresse, il s’avance vers la tribune de
l’ayuntamiento (municipalité), jette avec un grand geste noble sa
cape et sa montera empennée découvrant son faux chignon de
femme, il demande la permission de tuer.
Il prend son épée nue, la couvre d’une étoffe écarlate, la muleta,
et alors commence l’épisode le plus émouvant du drame.
Les capadors manœuvrent de façon à lui amener la bête comme
ils ont fait pour les banderilleros ; il doit l’attendre de pied ferme sans
jamais tourner le dos ni fuir, l’épée dissimulée par la muleta. C’est au
moment où il sent le souffle du taureau lui brûler les jambes, que le
matador frappe, et il frappe d’une façon convenue, à un endroit
précis, entre la nuque et les épaules, en passant le bras entre les
cornes, et plonge l’épée jusqu’à la garde.
Il arrive souvent qu’il manque son coup, et des huées s’élèvent
de tous les points de l’amphithéâtre ; on le couvre d’exécrations et
d’injures ; si l’épée n’est pas enfoncée assez profondément, il
l’arrache et recommence.
Quelquefois, le taureau choisit une place dans l’arène où il
retourne comme à une sorte de refuge. J’en vis un qui, poursuivant
un capador, s’arrêta devant le corps d’un cheval éventré dès le
début. Comme beaucoup font, il allait le labourer de ses cornes,
mais il sembla se raviser et flaira la bête morte. Dès lors, il revint
constamment à elle comme s’il retrouvait un compagnon de misère.
Peut-être ce cheval lui rappelait-il quelque libre étalon mêlé à son
troupeau dans les plaines du Mançanarès. Chassé par les
manœuvres de l’escadrille, il y retournait sans cesse, et enfin frappé
à l’extrémité opposée du cirque, chancelant, l’épée enfoncée entre
les épaules jusqu’à un demi-pied de la garde, il revint retrouver le
cheval, et tombant sur ses genoux, s’affaissa sur le cadavre.
Si le taureau blessé tarde à mourir, c’est l’affaire du cachetero,
appelé ainsi du poignard qu’il porte. Vêtu de noir, il saute dans
l’arène, et de son couteau affilé comme un scalpel, tranche l’épine
dorsale au-dessous de la nuque. Alors, aux éclats d’une fanfare,
s’ouvre la porte par où est entrée l’escadrille, et l’attelage des cinq
mules empanachées arrive au galop ; on y accroche chaque victime
qui est entraînée aussitôt. Autant de tués, autant de courses de
l’attelage. Le taureau est enlevé le dernier.
Les valets du cirque passent rapidement un râteau sur les traces
du sang, la porte du toril s’ouvre et un nouveau combattant s’élance.
La foule impatiente ne supporte pas d’entr’acte.
Quand le taureau a fait preuve d’une grande bravoure, qu’il n’a
pas été possible de le tuer, le peuple à grands cris demande sa
grâce. On introduit alors trois ou quatre bœufs dans l’arène, et la
bête, à la vue de ses frères, court heureuse les rejoindre et disparaît
avec eux.
Le peuple applaudit ; un soupir de soulagement s’échappe des
poitrines, on est satisfait d’avoir arraché à la mort le fier animal.
Mais pendant que ces beaux sentiments s’épanouissent, le
taureau livré au boucher est traîtreusement égorgé dans le toril.
Exécution nécessaire. La bête furieuse est désormais inabordable.
Impossible de la faire servir pour une nouvelle course. Échappée
aux savantes manœuvres des toreros, elle y échapperait d’autant
plus à une seconde reprise, et ce serait vouer plusieurs d’entre eux
à la mort.
A l’une des corridas de Madrid, un jeune taureau de mine
honnête avait toutes mes sympathies, un novillo de quatre ou cinq
ans à peine. Celui-là ne cherchait pas la bataille ; l’étonnement plutôt
que la colère se lisait dans ses grands yeux noirs ; il ne voulait la
mort de personne et semblait se demander pourquoi on l’avait
arraché de ses prairies de l’Andalousie pour le livrer à ces hommes
étranges qui le torturaient et lui enfonçaient des harpons dans le
corps. Et dans l’espoir de retourner là-bas, taureau de bon sens,
plus soucieux d’une génisse que de la gloire, il franchit seize fois la
barrière. A la seizième il refusa de rentrer, frappant du pied la terre,
mugissant de détresse. Enfin, harcelé par les chulos, étourdi par les
clameurs de vingt mille bouches furieuses, il bondit sur l’ennemi.
Encore deux banderilles à recevoir ; on les lui plante. Au moment où
il se secouait, cherchant à s’en délivrer avec son mufle, et où la
fanfare sonnait la mort, un capador s’approcha, le narguant de sa
cape. Une fois de plus il s’élança ; le torero fit une fausse
manœuvre, glissa, tomba sur un genou et une des cornes aiguës
traversa sa poitrine. Ce fut un grand tumulte ; les spectateurs se
levèrent, et, moi, j’éprouvai une satisfaction grande. La bête enfin se
vengeait. Je compris l’ardente frénésie de la foule, et debout,
appuyé sur la barrera, très excité, grisé par la vue du sang, je criai
frénétiquement comme les brunes Madrilènes : « Bravo toro ! bravo
toro ! »
Ceux qui sautent ainsi sont souvent les plus dangereux, car c’est
par sauvagerie et non par lâcheté ; le fait seul de franchir las tablas
indique une incroyable force de jarret. Mais certains s’acculent à la
barrière, refusent de combattre. On les appelle les applomados, les
plombés, et le peuple exige à grands cris qu’on leur mette le feu.
Banderillas de fuego ! Banderillas de fuego ! Ces mots comme un
tonnerre roulent de tous les gradins. Mais il faut le consentement de
l’alcade. S’il hésite, c’est contre lui que se tournent les colères, c’est
lui qu’on menace de brûler. La férocité de la population madrilène
s’étale sans vergogne : Fuego à l’alcade ! Fuego à l’alcade ! Enfin il
agite son mouchoir, signe de son acquiescement. Les banderilles de
feu sont prêtes ; ce sont des fusées qui s’enfoncent comme les
banderilles ordinaires, éclatent sous cuir, déchirent et brûlent la
peau ; pas de bête, si plombée qu’elle soit, qui ne s’échauffe et ne
se déplombe à ce régime. Les plus apathiques font des prodiges, les
moutons deviennent enragés. Et, devant les souffrances,
l’affolement, les torsions et les sauts, se manifeste à grand bruit la
joie de la foule. L’enthousiasme touche au délire, si les gradins
n’étaient de pierre, ils crouleraient sous les trépignements.
Ah ! ce sont bien les fils de ces hommes qui brûlaient dans leurs
autodafés les victimes de leur rage religieuse, enfermées en masse
dans des statues de plâtre, qui mutilaient leurs prisonniers de
guerre ; les descendants de ces bandits qui à la suite des Pizarre et
des Cortez grillaient leurs otages, dévastaient le Nouveau Monde,
détruisant les opulentes cités, massacrant femmes et enfants !
Que cinquante paires de gladiateurs s’entre-choquent dans
l’arène, qu’ils se tuent pour l’amusement de la plèbe, puisque à la
plèbe il faut du sang ! Au moins ils savent ce qu’ils font et pourquoi
ils s’entaillent ; on les a payés pour la mort ; ils ont vendu leur chair à
la cité féroce et ils luttent, armes égales, œil contre œil, muscles
contre muscles, glaive contre glaive. Mais l’acharnement de cette
foule contre une bête, ces chevaux éventrés, ces taureaux torturés,
déchirés, sanglants !… Mais que dis-je ? de cette foule, nous en
sommes ; nous comptons tous des bandits parmi nos ancêtres ; nos
pères aussi faisaient des hécatombes ; et l’antique férocité qui
sommeille au fond du cœur de chacun, il suffit d’une étincelle, d’un
reflet de lame, d’une goutte de sang pour la réveiller, et alors nous
voyons rouge. Et c’est pourquoi, quand nous avons assisté à une de
ces boucheries, nous voulons en revoir une autre. On y retourne une
fois, deux fois, dix fois ; on devient un habitué de l’arène, un
dilettante de tauromachie. Pas un Français, pas un Anglais,
rencontré en Espagne, qui après les premiers écœurements n’ait
pris goût à ces tueries.
Dans les villes et bourgades du Nord, à proximité de nos
frontières, à Saint-Sébastien, à Bilbao, à Pampelune, à Barcelone,
les Plazas de Toros sont amplement garnies de nos méridionaux,
venus tout exprès chercher des émotions violentes, et ils ne sont
pas les derniers à crier comme les Biscayens ou les Catalans,
lorsque la bête a été brave, qu’il y a eu poitrine d’homme ouverte :
Bravo ! bravo toro !
Le dernier taureau de la journée tué, la populace escalade
gradins et barrières, envahit l’arène, et comme une nuée de chacals
se précipite sur le cadavre. Les uns se vautrent sur le corps, d’autres
saisissent ses cornes sanglantes, d’autres le frappent du pied,
plongent le doigt dans la blessure béante. On l’accroche enfin au
brancard, et lorsque les mules l’emportent au galop, il y a toujours
quelqu’un de la plèbe qui, cramponné à la queue, se laisse traîner
avec le corps. En une minute l’arène est comble, cinq ou six cents
drôles, rebuts de la ville s’agitent en tous sens, hurlent, sifflent, se
poussent, se roulent ; et je formais ce vœu impie : Si la porte du toril
pouvait s’ouvrir, lâchant un de ses hôtes, cornes dressées ! Quelle
belle trouée dans l’amas grouillant ! Quelle panique, quelle fugue et
quelles culbutes !
Je me délectais à cette pensée cynique, devenu féroce par
contagion, lorsque tout à coup le toril s’ouvre et de la noire ouverture
surgit un superbe taureau. Je n’étais pas revenu de ma stupéfaction
que comme un boulet monstre il trouait la multitude. Grands cris et
terrible bousculade. Je n’en croyais pas mes yeux et haletant, le
corps penché, je plongeais dans l’arène.
Du sang ! des flots de sang ! Non, du sol ne se lèvent que des
flots de poussière et cependant, cornes basses, le taureau furieux
continue ses trouées.
Déception ! ceux qu’il renversait et foulait de son sabot se
relevaient presque aussitôt. Les cornes étaient emboulonnées, mais
elles pouvaient encore endommager reins et poitrines ; aussi plus
d’un qui recevait le choc s’en allait chancelant, soutenu par des
camarades.
On lâche ainsi l’un après l’autre, dès que la course est finie, trois
ou quatre taureaux dans la foule pour son propre amusement. La
plèbe joue au capador. Vestes et paletots retirés sont agités en
guise de capes autour de la bête qui bientôt s’affole, et la première
fureur passée, finit par tourner éperdue sur elle-même. Quand son
désarroi a suffisamment duré, on pousse dans le cirque trois ou
quatre bœufs qui emmènent leur compagnon.
XVIII
LES TOREROS

Les Parisiens n’ont pu qu’imparfaitement juger, par les courses


de l’Hippodrome, de ce que peuvent être les véritables corridas
quand la bête furieuse menace de ses cornes ensanglantées la
poitrine des toreros.
Ce n’est pas un métier facile, et plus d’un sort de l’arène le corps
troué, estropié pour la vie. Aussi, dans chaque cirque, une chambre
et des lits garnis de sœurs de charité attendant l’hôte de cet hôpital
provisoire. Il est peu de toreros qui n’aient une côte enfoncée ou une
cuisse traversée après un an ou deux d’exercice.
Le célèbre Manuel Dominguez, mort à Séville, en 1885, à l’âge
de soixante-quinze ans, était criblé de cicatrices comme rarement le
fut vétéran de la Grande Armée. Outre des éraflures, avaries,
meurtrissures, horions, coups de corne sans nombre, il eut quatre
fois la cuisse traversée de part en part, un œil crevé, une profonde
encornade près de l’anus, deux autres dans la fesse, une au côté
droit. Il mourut, on le voit, couvert de blessures et de gloire. Passé
soixante-dix ans, il tuait encore le taureau : sa dernière bataille fut
livrée à Séville, en faveur des inondés de Murcie.
Manuel Ereria, jeune matador qui, pendant mon séjour à Séville,
me donna maints détails sur les gens de sa profession, eut, dès ses
débuts dans la carrière, deux côtes enfoncées, et dans sa chute une
banderille lui traversa la cuisse.
Il n’est guère plus d’une douzaine de célébrités tauromachiques ;
on les appelle les primas espadas, premières épées, et leur
réputation surpasse celle des plus illustres écrivains et des plus
grands hommes d’État.
Si donc le métier est dangereux, il est glorieux, et la gloire qui en
jaillit n’est pas improductive. Jerez Frascuela, Salvador Sanchez,
Manuel Garcia, Lagartijo, Cara Ancha, Angel Pastor, Valentin,
Raphael, Mazzantini gagnent de 10 000 à 14 000 réaux par course
(2500 à 3500 francs). Ce n’est pas, il est vrai, ce que gagnent
certains de nos chanteurs ou de nos histrionnes, mais c’est déjà un
beau denier. Mazzantini, demandé en 1885 à Buenos-Ayres, avec
son escadrille, réalisa en deux mois un bénéfice de 150 000 francs.
Mais ceux-là sont les gros seigneurs des courses, les Hugos, les
Dumas, les Zolas, les Ohnets de la corporation. Les autres bons
matadors se contentent de sommes moindres, 1000 à 1500 francs
par corrida. Quant aux banderilleros et aux picadors, leurs
appointements ne dépassent guère 30 ou 40 douros (150 à 200
francs), bien qu’ils courent presque autant de dangers.
L’été dernier, une très jolie fille, la Frayosa, fit les délices de la
foule en qualité de prima espada. On l’a dit d’une agilité et d’une
grâce étonnantes. Probablement que le brillant costume qui mettait
ses charmes en relief fut pour beaucoup dans l’engouement.
En tous cas, c’est une vaillante, et rien qu’à ses débuts, elle
gagnait de 2 à 3000 réaux. Les Anglais en raffolent, des lords
sérieux lui firent des propositions déshonnêtes, elle les repoussa en
haine de l’étranger qui vola Gibraltar. Je doute qu’elle ait plu aux
femmes autant qu’un mâle matador,

Mais tous les hommes en sont fous,

et les dévotes scandalisées apprendront quelque jour


Que l’archevêque de Tolède
A dit la messe à ses genoux.

De toutes les idoles qu’acclama jamais la multitude penchée


béante sur les gradins d’un théâtre ou d’un cirque, il n’en est pas de
plus glorieuse que la prima espada, au moment où, le taureau
mortellement frappé, elle reçoit les applaudissements frénétiques de
vingt mille spectateurs.
Quels bravos et quel triomphe ! et comme celui du pâle comédien
usé par le travail en une atmosphère chaude et viciée, brûlé par les
feux de la rampe, vieux avant l’âge, est misérable comparé à
l’apothéose en plein soleil du fier matador, jeune, beau, agile, plein
de vigueur et de santé, brillant et élégant emblème de l’adresse et
de la valeur. Les acclamations retentissent, les hourras éclatent, la
fanfare lance ses airs de victoire, hommes et femmes crient son nom
et les yeux des señoritas le caressent et le brûlent. A cet instant,
d’un geste, il aurait un gynécée. Bravo ! Bravo ! Manuel Ereria !
Éventails, fleurs, oranges, parasols pleuvent autour de lui ; les plus
enthousiastes détachent leurs bracelets, qui vont rouler aux pieds du
triomphateur. Et lui se baisse, ramasse le gage d’admiration et
rejette à chacune son bien en saluant d’un geste gracieux.
A l’égal des soldats, les toreros sont la coqueluche des femmes.
Rien que de naturel. Dans tous pays la femme admire le courage,
elle aime meurtrir son cœur aux rudes approches de celui dont le
cœur est d’acier. Et c’est justice ; est plus digne d’admiration celui
qui joue sa vie contre les hommes, les fauves ou les tempêtes, que
celui qui coule la sienne assis sur un rond de cuir.
Aussi, fiers des bravos, portent-ils une sorte d’uniforme qui les
distingue de la foule. Petit chapeau à ruban de soie, veste courte à
collet de velours, gilet ouvert montrant le jabot de la chemise brodé
par une douce main et dont le col rabattu est d’une extrême exiguïté,
manchettes également brodées, ceinture bleue et souliers vernis.
Une lourde chaîne et une montre énorme, grand luxe des
Espagnols, complètent l’habillement sur lequel jure le hideux

You might also like