You are on page 1of 53

9th International Workshop on Spoken

Dialogue System Technology Luis


Fernando D'Haro
Visit to download the full and correct content document:
https://textbookfull.com/product/9th-international-workshop-on-spoken-dialogue-syste
m-technology-luis-fernando-dharo/
More products digital (pdf, epub, mobi) instant
download maybe you interests ...

Conversational Dialogue Systems for the Next Decade 704


Luis Fernando D'Haro (Editor)

https://textbookfull.com/product/conversational-dialogue-systems-
for-the-next-decade-704-luis-fernando-dharo-editor/

Simulation-Based Usability Evaluation of Spoken and


Multimodal Dialogue Systems 1st Edition Stefan Hillmann
(Auth.)

https://textbookfull.com/product/simulation-based-usability-
evaluation-of-spoken-and-multimodal-dialogue-systems-1st-edition-
stefan-hillmann-auth/

Advances in Social Computing and Digital Education 7th


International Workshop on Collaborative Agents Research
and Development CARE 2016 Singapore May 9 2016 and
Second International Workshop on Social Computing in
Digital Education SocialEdu 2016 1st Edition Fernando
https://textbookfull.com/product/advances-in-social-computing-
and-digital-education-7th-international-workshop-on-
Koch
collaborative-agents-research-and-development-
care-2016-singapore-may-9-2016-and-second-international-workshop-
on-socia/
Critical Care Obstetrics 6th Edition Luis D. Pacheco

https://textbookfull.com/product/critical-care-obstetrics-6th-
edition-luis-d-pacheco/
Soap Manufacturing Technology Second Edition Luis Spitz

https://textbookfull.com/product/soap-manufacturing-technology-
second-edition-luis-spitz/

Numerical Software Verification 9th International


Workshop NSV 2016 Toronto ON Canada July 17 18 2016
Revised Selected Papers 1st Edition Sergiy Bogomolov

https://textbookfull.com/product/numerical-software-
verification-9th-international-workshop-nsv-2016-toronto-on-
canada-july-17-18-2016-revised-selected-papers-1st-edition-
sergiy-bogomolov/

Advances in Information and Computer Security 9th


International Workshop on Security IWSEC 2014 Hirosaki
Japan August 27 29 2014 Proceedings 1st Edition Maki
Yoshida
https://textbookfull.com/product/advances-in-information-and-
computer-security-9th-international-workshop-on-security-
iwsec-2014-hirosaki-japan-august-27-29-2014-proceedings-1st-
edition-maki-yoshida/

Methodologies and Intelligent Systems for Technology


Enhanced Learning, 9th International Conference Rosella
Gennari

https://textbookfull.com/product/methodologies-and-intelligent-
systems-for-technology-enhanced-learning-9th-international-
conference-rosella-gennari/

Sugarcane Biorefinery Technology and Perspectives 1st


Edition Fernando Santos (Editor)

https://textbookfull.com/product/sugarcane-biorefinery-
technology-and-perspectives-1st-edition-fernando-santos-editor/
Lecture Notes in Electrical Engineering 579

Luis Fernando D’Haro


Rafael E. Banchs
Haizhou Li Editors

9th International
Workshop on
Spoken Dialogue
System
Technology
Lecture Notes in Electrical Engineering

Volume 579

Series Editors
Leopoldo Angrisani, Department of Electrical and Information Technologies Engineering, University of Napoli
Federico II, Naples, Italy
Marco Arteaga, Departament de Control y Robótica, Universidad Nacional Autónoma de México, Coyoacán,
Mexico
Bijaya Ketan Panigrahi, Electrical Engineering, Indian Institute of Technology Delhi, New Delhi, Delhi, India
Samarjit Chakraborty, Fakultät für Elektrotechnik und Informationstechnik, TU München, Munich, Germany
Jiming Chen, Zhejiang University, Hangzhou, Zhejiang, China
Shanben Chen, Materials Science and Engineering, Shanghai Jiao Tong University, Shanghai, China
Tan Kay Chen, Department of Electrical and Computer Engineering, National University of Singapore,
Singapore, Singapore
Rüdiger Dillmann, Humanoids and Intelligent Systems Lab, Karlsruhe Institute for Technology, Karlsruhe,
Baden-Württemberg, Germany
Haibin Duan, Beijing University of Aeronautics and Astronautics, Beijing, China
Gianluigi Ferrari, Università di Parma, Parma, Italy
Manuel Ferre, Centre for Automation and Robotics CAR (UPM-CSIC), Universidad Politécnica de Madrid,
Madrid, Spain
Sandra Hirche, Department of Electrical Engineering and Information Science, Technische Universität
München, Munich, Germany
Faryar Jabbari, Department of Mechanical and Aerospace Engineering, University of California, Irvine, CA,
USA
Limin Jia, State Key Laboratory of Rail Traffic Control and Safety, Beijing Jiaotong University, Beijing, China
Janusz Kacprzyk, Systems Research Institute, Polish Academy of Sciences, Warsaw, Poland
Alaa Khamis, German University in Egypt El Tagamoa El Khames, New Cairo City, Egypt
Torsten Kroeger, Stanford University, Stanford, CA, USA
Qilian Liang, Department of Electrical Engineering, University of Texas at Arlington, Arlington, TX, USA
Ferran Martin, Departament d’Enginyeria Electrònica, Universitat Autònoma de Barcelona, Bellaterra,
Barcelona, Spain
Tan Cher Ming, College of Engineering, Nanyang Technological University, Singapore, Singapore
Wolfgang Minker, Institute of Information Technology, University of Ulm, Ulm, Germany
Pradeep Misra, Department of Electrical Engineering, Wright State University, Dayton, OH, USA
Sebastian Möller, Quality and Usability Lab, TU Berlin, Berlin, Germany
Subhas Mukhopadhyay, School of Engineering & Advanced Technology, Massey University, Palmerston
North, Manawatu-Wanganui, New Zealand
Cun-Zheng Ning, Electrical Engineering, Arizona State University, Tempe, AZ, USA
Toyoaki Nishida, Graduate School of Informatics, Kyoto University, Kyoto, Japan
Federica Pascucci, Dipartimento di Ingegneria, Università degli Studi “Roma Tre”, Rome, Italy
Yong Qin, State Key Laboratory of Rail Traffic Control and Safety, Beijing Jiaotong University, Beijing, China
Gan Woon Seng, School of Electrical & Electronic Engineering, Nanyang Technological University,
Singapore, Singapore
Joachim Speidel, Institute of Telecommunications, Universität Stuttgart, Stuttgart, Baden-Württemberg,
Germany
Germano Veiga, Campus da FEUP, INESC Porto, Porto, Portugal
Haitao Wu, Academy of Opto-electronics, Chinese Academy of Sciences, Beijing, China
Junjie James Zhang, Charlotte, NC, USA
The book series Lecture Notes in Electrical Engineering (LNEE) publishes the latest developments
in Electrical Engineering - quickly, informally and in high quality. While original research
reported in proceedings and monographs has traditionally formed the core of LNEE, we also
encourage authors to submit books devoted to supporting student education and professional
training in the various fields and applications areas of electrical engineering. The series cover
classical and emerging topics concerning:

• Communication Engineering, Information Theory and Networks


• Electronics Engineering and Microelectronics
• Signal, Image and Speech Processing
• Wireless and Mobile Communication
• Circuits and Systems
• Energy Systems, Power Electronics and Electrical Machines
• Electro-optical Engineering
• Instrumentation Engineering
• Avionics Engineering
• Control Systems
• Internet-of-Things and Cybersecurity
• Biomedical Devices, MEMS and NEMS
For general information about this book series, comments or suggestions, please contact leontina.
dicecco@springer.com.
To submit a proposal or request further information, please contact the Publishing Editor in your
country:
China
Jasmine Dou, Associate Editor (jasmine.dou@springer.com)
India
Aninda Bose, Senior Editor (aninda.bose@springer.com)
Japan
Takeyuki Yonezawa, Editorial Director (takeyuki.yonezawa@springer.com)
South Korea
Smith (Ahram) Chae, Editor (smith.chae@springer.com)
Southeast Asia
Ramesh Nath Premnath, Editor (ramesh.premnath@springer.com)
USA, Canada:
Michael Luby, Senior Editor (michael.luby@springer.com)
All other Countries:
Leontina Di Cecco, Senior Editor (leontina.dicecco@springer.com)
Christoph Baumann, Executive Editor (christoph.baumann@springer.com)

** Indexing: The books of this series are submitted to ISI Proceedings, EI-Compendex,
SCOPUS, MetaPress, Web of Science and Springerlink **

More information about this series at http://www.springer.com/series/7818


Luis Fernando D’Haro•

Rafael E. Banchs Haizhou Li


Editors

9th International Workshop


on Spoken Dialogue System
Technology

123
Editors
Luis Fernando D’Haro Rafael E. Banchs
Universidad Politécnica de Madrid Nanyang Technological University
Madrid, Spain Singapore, Singapore

Haizhou Li
Department of Electrical and Computer
Engineering
National University of Singapore
Singapore, Singapore

ISSN 1876-1100 ISSN 1876-1119 (electronic)


Lecture Notes in Electrical Engineering
ISBN 978-981-13-9442-3 ISBN 978-981-13-9443-0 (eBook)
https://doi.org/10.1007/978-981-13-9443-0
© Springer Nature Singapore Pte Ltd. 2019
This work is subject to copyright. All rights are reserved by the Publisher, whether the whole or part
of the material is concerned, specifically the rights of translation, reprinting, reuse of illustrations,
recitation, broadcasting, reproduction on microfilms or in any other physical way, and transmission
or information storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar
methodology now known or hereafter developed.
The use of general descriptive names, registered names, trademarks, service marks, etc. in this
publication does not imply, even in the absence of a specific statement, that such names are exempt from
the relevant protective laws and regulations and therefore free for general use.
The publisher, the authors and the editors are safe to assume that the advice and information in this
book are believed to be true and accurate at the date of publication. Neither the publisher nor the
authors or the editors give a warranty, expressed or implied, with respect to the material contained
herein or for any errors or omissions that may have been made. The publisher remains neutral with regard
to jurisdictional claims in published maps and institutional affiliations.

This Springer imprint is published by the registered company Springer Nature Singapore Pte Ltd.
The registered company address is: 152 Beach Road, #21-01/04 Gateway East, Singapore 189721,
Singapore
Program Committee

Masahiro Araki, Kyoto Institute of Technology, Japan


Ron Artstein, University of Southern California, USA
Rafael E. Banchs, Nanyang Technological University, Singapore
Timo Baumann, Universität Hamburg, Germany
Jérôme Bellegarda, Apple, Inc., USA
Tim Bickmore, Northeastern University, USA
Jeffrey Bigham, Carnegie Mellon University, USA
Johan Boye, KTH Royal Institute of Technology, Sweden
Axel Buendia, SpirOps AI, France
Susanne Burger, Carnegie Mellon University, USA
Felix Burkhard, Institut für Sprache und Kommunikation, TU, Germany
Frédéric Béchet, Aix Marseille University, France
Zoraida Callejas, University of Granada, Spain
Nick Campbell, Trinity College Dublin, Ireland
Léonardo Campillos, LIMSI-CNRS, France
Luísa Coheur, IST/INESC-ID Lisboa
Marta Ruiz Costajussa, Universitat Politècnica de Catalunya, Spain
Luis Fernando D’Haro, Universidad Politécnica de Madrid, Spain
Justin Dauwels, Nanyang Technological University, Singapore
Yasuharu Den, Chiba University, Japan
Maxine Eskenazi, Carnegie Mellon University, USA
Anna Esposito, Università di Napoli, Italy
Morgan Fredriksson, Liquid Media/Nagoon, Sweden
Kotaro Funakoshi, Honda Research Institute Japan Co., Ltd.
Sadaoki Furui, Tokyo Institute of Technology, Japan
Milica Gasic, University of Cambridge, UK
Kallirroi Georgila, University of Southern California, USA
Emer Gilmartin, Speech Communications Lab, Trinity College Dublin, Ireland
Jonathan Ginzburg, Université Paris Diderot-Paris 7, France
David Griol, Universidad Carlos III de Madrid, Spain
Rainer Gruhn, Nuance Communications, Germany

v
vi Program Committee

Joakim Gustafson, KTH Royal Institute of Technology, Sweden


Sunao Hara, Okayama University, Japan
Martin Heckmann, Honda Research Institute Europe GmbH, Germany
Paul Heisterkamp, Daimler AG, Germany
Ryuichiro Higashinaka, NTT Corp, Japan
Julia Hirschberg, Columbia University, USA
Chiori Hori, Mitsubishi Electric Research Laboratories, USA
David House, KTH Royal Institute of Technology, Sweden
Kristiina Jokinen, University of Helsinki, Finland
Tatsuya Kawahara, Kyoto University, Japan
Harksoo Kim, Kangwon National University, Korea
Hong Kook Kim, Gwangju Institute of Science and Technology, Korea
Seokhwan Kim, Adobe Research, USA
Kazunori Komatani, Osaka University, Japan
Girish Kumar, Carousell, Singapore
Nio Lasguido, Rakuten Institute of Technology, Japan
Hung-Yi Lee, National Taiwan University, Taiwan
Kyusong Lee, Carnegie Mellon University, USA
Lin-Shan Lee, National Taiwan University, Taiwan
Fabrice Lefèvre, University of Avignon, LIA-CERI, France
Oliver Lemon, Heriot-Watt University, UK
Haizhou Li, National University of Singapore, Singapore
Pierre Lison, Norsk Regnesentral, Norway
Diane Litman, University of Pittsburgh, USA
José David Lopes, Heriot-Watt University, UK
Ramón López-Cozar Delgado, University of Granada, Spain
Joseph-Jean Mariani, LIMSI-CNRS, France
Yoichi Matsuyama, Carnegie Mellon University, USA
Michael McTear, Ulster University, UK
Etsuo Mizukami, National Institute of Information and Communications
Technology (NICT), Japan
Samer Al Moubayed, KTH, Sweden
Satoshi Nakamura, Nara Institute of Science and Technology, Japan
Mikio Nakano, Honda Research Institute, Japan
Andreea Niculescu, Institute for Infocomm Research, Singapore
Takuichi Nishimura, National Institute of Advanced Industrial Science and
Technology (AIST), Japan
Elmar Nöth, University of Erlangen-Nuremberg, Germany
Yoo Rhee Oh, Electronics and Telecommunications Research Institute, Korea
Kiyonori Otake, National Institute of Information and Communications Technology
(NICT), Japan
Catherine Pelachaud, CNRS—ISIR, Sorbonne Université, France
Volha Petukhova, Saarland University, Germany
Roberto Pieraccini, Jibo Inc., USA
Oliver Pietquin, Google DeepMind, USA
Program Committee vii

Zahra Rahimi, University of Pittsburgh, USA


Norbert Reithinger, DFKI GmbH, Germany
Jiang Ridong, Institute for Infocomm Research, Singapore
Verena Rieser, Heriot-Watt University, UK
Sophie Rosset, LIMSI, CNRS, Université Paris-Saclay, France
Alexander Rudnicky, Carnegie Mellon University, USA
Sakriani Sakti, NAIST, Japan
Carlos Segura Perales, Telefonica I+D, Spain
Gabriel Skantze, KTH Royal Institute of Technology, Sweden
Svetlana Stoyanchev, Columbia University, USA
Sebastian Stüker, Karlsruhe Institute of Technology, Germany
Mariet Theune, University of Twente, Netherlands
María Inés Torres, Universidad del País Vasco, Spain
David Traum, USC Institute for Creative Technologies, USA
Stefan Ultes, University of Cambridge, UK
Hsin-Min Wang, Academia Sinica, Taiwan
Nigel Ward, University of Texas at El Paso, USA
Jason Williams, Microsoft Research, USA
Koichiro Yoshino, Kyoto University, Japan
Zhou Yu, University of California, Davis, USA
Tiancheng Zhao, Carnegie Mellon University, USA
Preface

The 9th International Workshop on Spoken Dialog Systems (IWSDS’18) was held
on April 18–20, 2018, in Singapore; being the southernmost IWSDS ever, just one
degree north of the Equator! The conference allowed participants to keep track
of the state-of-the-art in spoken dialogue systems, while enjoying the year-round
summer paradise island that is Singapore.
The IWSDS conference series brings together, on a yearly basis, international
researchers working in the field of spoken dialogue systems and associated tech-
nologies. It provides an international forum for the presentation of current research,
applications, technological challenges, and discussions among researchers and
industrialists. The IWSDS’18 edition built over the success of the previous 8th
editions:
• IWSDS’09 (Irsee, Germany),
• IWSDS’10 (Gotemba Kogen Resort, Japan),
• IWSDS’11 (Granada, Spain),
• IWSDS’12 (Paris, France),
• IWSDS’14 (Napa, USA),
• IWSDS’15 (Busan, Korea),
• IWSDS’16 (Saariselkä, Finland), and
• IWSDS’17 (Farmington, PA, USA).
IWSDS’18 conference theme was “Towards creating more human-like conversa-
tional agent technologies”, inviting and receiving paper submissions on the fol-
lowing topics:
• Engagement and emotion in human–robot interactions.
• Digital resources for interactive applications.
• Multi-modal and machine learning methods.
• Companions, personal assistants, and dialogue systems.
• Proactive and anticipatory interactions.
• Educational and healthcare robot applications.
• Dialogue systems and reasoning.

ix
x Preface

• Big data and large-scale spoken dialogue systems.


• Multi-lingual dialogue systems.
• Spoken dialog systems for low-resource languages.
• Domain transfer and adaptation techniques for spoken dialog systems.
However, submissions were not limited to these topics, and submission of papers in
all areas of spoken dialogue systems was encouraged. In particular, IWSDS’18
welcomed also papers that could be illustrated by a demonstrator, organizing the
conference to best accommodate these papers whatever their category.
The program of IWSDS’18 included three keynotes by renowned international
authorities in dialogue system research:
• Prof. Tatsuya Kawahara from Kyoto University in Japan,
• Prof. Alex Waibel from Carnegie Mellon University in USA and Karlsruhe
Institute of Technology in Germany, and
• Prof. David Traum from University of Southern California in USA.
The keynote speech by Prof. Tatsuya Kawahara was entitled: “Spoken dialogue for
a human-like conversational robot ERICA”. He described a symbiotic human–robot
interaction project, which aims at an autonomous android who behaves and inter-
acts just like a human. This conversational android called ERICA is designed to
conduct several social roles focused on spoken dialogue, such as attentive listening
(similar to counseling) and job interview. Finally, he described the design princi-
ples, problems, and current solutions when developing the different spoken dia-
logue modules included in ERICA.
The keynote speech by Prof. Alex Waibel was entitled: “M3 Dialogs—
Multimodal, Multilingual, Multiparty”. He started describing that even though great
progress has been made in building and deploying speech dialog systems, they are
still rather siloed and limited in scope, domain, style, language, and participants.
Most systems are strictly human–machine, one language, one request at a time,
usually with a clear on–off signal and identification of who wants what from whom.
Even though existing systems do this now rather well, they fall far short of the ease,
breadth, and robustness with which humans can communicate. During his talk,
Prof. Waibel claimed that a dialog is not only human–machine, but also human–
human, human–machine–human, and machine–machine–human, and preferably all
of the above in purposeful integration. Then, he outlined the flexibility we are
missing in modern dialog systems, review several of efforts aimed at addressing
them, and finished speculating on future directions for the research community.
The keynote speech by Prof. David Traum was entitled: “Beyond Dialogue
System Dichotomies: Principles for Human-Like Dialogue”. He started describing
how many researchers have proposed related dichotomies contrasting two different
kinds and aims of dialogue systems. One of the issues is whether human–system
dialogue should even be human-like at all or humans should adapt themselves to the
constraints given by the system. Then, he explored these dichotomies and presented
“role-play dialogue” as a place where these dichotomies can find a commonality of
purpose and where being human-like is important even simply for effective task
Preface xi

performance. After that, he defined “Human-like Dialogue” (HLD) as distinct from


purely human dialogue and also distinct from instrumental dialogue. Then, he
finished giving some guideline principles on how we should create and evaluate the
new generation of agents.
In addition, the IWSDS’18 included three special sessions:
• EMPATHIC: Empathic Dialog Systems for Elderly Assistance,
• HUMIC-DIAL: Designing Humor in HCI with Focus on Dialogue Technology,
• WOCHAT: Workshop on Chatbots and Conversational Agent Technologies.
The EMPATHIC session was organized by Prof. María Inés Torres, Universidad
del País Vasco UPV/EHU (Spain), Prof. Kristiina Jokinen, AIRC-AIST (Japan),
Prof. Gérard Chollet, Intelligent Voice (UK), and Prof. Marilyn Walker, University
of California-Santa Cruz (USA). This session focused on the problem of generating
Empathic Dialog Systems for Elderly Assistance. One of the more important
applications of spoken dialog systems (SDS) is the development of personal
assistants for elderly people. These kinds of systems are intended to provide per-
sonalized advice guidance through a spoken dialogue system to improve the quality
of life and independency living status of the people as they aged. To this end, SDS
has to deal not only with user goals but also implement health goals through
negotiation strategies to convince the user to develop healthy habits. Such SDS
should also include perceived user affective status to support the dialog manager
decisions. This session also welcomed papers focused on affective computing in
SDS, user-centered design, policies dealing with shared user-coach goals, man-
agement strategies to keep the user engagement, personalization and adaptation,
ontologies, and knowledge representation.
The HUMIC-DIAL session was organized by Dr. Andreea I. Niculescu, Institute
for Infocomm Research (I2R, Singapore), Dr. Rafael E. Banchs, Nanyang
Technological University (Singapore), Dr. Bimlesh Wadhwa, National University
of Singapore (NUS, Singapore), Prof. Dr. Anton Nijholt, University of Twente (The
Netherlands), and Dr. Alessandro Valitutti, Università di Bari (Italy). After a suc-
cessful first edition of HUMIC (HUMor in InteraCtion) at INTERACT 2017, for
IWSDS’18, the organizers focused on humorous verbal dialogue interactions
between humans and machines. Humor embracing various types of expression can
be used to enhance the interaction outcome while being socially and culturally
appropriate. Therefore, during this session the presented papers explored challenges
in designing, implementing, and evaluating humorous interactions in spoken and
written dialogues with artificial entities, as well as benefits and downsides of using
humor in such interactive tasks.
The WOCHAT session was organized by Dr. Ryuichiro Higashinaka, Nippon
Telegraph and Telephone Corporation (Japan), Prof. Ron Artstein, University of
Southern California (USA), Prof. Rafael E. Banchs, Nanyang Technological
University (Singapore), Prof. Wolfgang Minker, Ulm University (Germany), and
Prof. Verena Rieser, Heriot-Watt University (UK). The session included a Shared
xii Preface

Task organized by Prof. Bayan Abu Shawar, Arab Open University (Jordan), Prof.
Luis Fernando D’Haro, Universidad Politécnica de Madrid, Spain, and Prof. Zhou
Yu, University of California, Davis (USA). This was the fifth event of a “Workshop
and Special Session Series on Chatbots and Conversational Agents”. WOCHAT
aims at bringing together researchers working on problems related to chat-oriented
dialogue with the objective of promoting discussion and knowledge sharing about
the state-of-the-art and approaches in this field, as well as coordinating a collabo-
rative effort to collect/generate data, resources, and evaluation protocols for future
research in this area. The WOCHAT series also accommodated a Shared Task on
Data Collection and Annotation for generating resources that can be made publicly
available to the rest of the research community for further research and experi-
mentation. In this shared task, human–machine dialogues are generated by using
different online and offline chat engines, and annotations are generated following
some basic provided guidelines.
IWSDS’18 received a total of 52 submissions, where each submission was
reviewed by at least two program committee members. The committee decided to
accept a total of 37 papers: 13 long papers, 6 short papers, 4 demo papers, 4 papers
for the Empathic session, 7 papers for the WOCHAT session, 2 papers for the
Humic session, and 1 invited paper.
Finally, we would like to take this opportunity to thank the IWSDS Steering
Committee and the members of the IWSDS’18 Scientific Committee for their
timely and efficient contributions and for completing the review process on time. In
addition, we would like to express our gratitude to the members of the Local
Committee who highly contributed to the success of the workshop, making it an
unforgettable experience for all participants. Last, but not least, we want also to
thank our sponsors: the Special Group on Discourse and Dialogue (SIGDial) and
Chinese and Oriental Languages Information Processing Society (COLIPS) for
their economical and logistic support; without it we and participants could not have
such a remarkable conference.

With our highest appreciation,

Madrid, Spain Luis Fernando D’Haro


Singapore Rafael E. Banchs
Singapore Haizhou Li
April 2019
Contents

Language and Social Context Understanding


Attention Based Joint Model with Negative Sampling for New Slot
Values Recognition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Mulan Hou, Xiaojie Wang, Caixia Yuan, Guohua Yang, Shuo Hu
and Yuanyuan Shi
Dialogue Act Classification in Reference Interview Using
Convolutional Neural Network with Byte Pair Encoding . . . . . . . . . . . . 17
Seiya Kawano, Koichiro Yoshino, Yu Suzuki and Satoshi Nakamura
“I Think It Might Help If We Multiply, and Not Add”:
Detecting Indirectness in Conversation . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Pranav Goel, Yoichi Matsuyama, Michael Madaio and Justine Cassell
Automated Classification of Classroom Climate by Audio Analysis . . . . 41
Anusha James, Yi Han Victoria Chua, Tomasz Maszczyk,
Ana Moreno Núñez, Rebecca Bull, Kerry Lee and Justin Dauwels
Automatic Turn-Level Language Identification for Code-Switched
Spanish–English Dialog . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Vikram Ramanarayanan, Robert Pugh, Yao Qian
and David Suendermann-Oeft

Dialogue Management and Pragmatic Models


Spoken Dialogue System for a Human-like Conversational
Robot ERICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Tatsuya Kawahara
Dialog State Tracking for Unseen Values Using an Extended
Attention Mechanism . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Takami Yoshida, Kenji Iwata, Hiroshi Fujimura and Masami Akamine

xiii
xiv Contents

Generating Fillers Based on Dialog Act Pairs for Smooth Turn-Taking


by Humanoid Robot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Ryosuke Nakanishi, Koji Inoue, Shizuka Nakamura, Katsuya Takanashi
and Tatsuya Kawahara
Testing Strategies For Bridging Time-To-Content In Spoken
Dialogue Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Soledad López Gambino, Sina Zarrieß and David Schlangen
Faster Responses Are Better Responses: Introducing Incrementality
into Sociable Virtual Personal Assistants . . . . . . . . . . . . . . . . . . . . . . . . 111
Vivian Tsai, Timo Baumann, Florian Pecune and Justine Cassell
Latent Character Model for Engagement Recognition
Based on Multimodal Behaviors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Koji Inoue, Divesh Lala, Katsuya Takanashi and Tatsuya Kawahara
Utilizing Argument Mining Techniques for Argumentative
Dialogue Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
Niklas Rach, Saskia Langhammer, Wolfgang Minker and Stefan Ultes

Dialogue Evaluation and Analysis


Multimodal Dialogue System Evaluation: A Case Study Applying
Usability Standards . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
Andrei Malchanau, Volha Petukhova and Harry Bunt
Toward Low-Cost Automated Evaluation Metrics for Internet
of Things Dialogues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
Kallirroi Georgila, Carla Gordon, Hyungtak Choi, Jill Boberg, Heesik Jeon
and David Traum
Estimating User Satisfaction Impact in Cities Using Physical Reaction
Sensing and Multimodal Dialogue System . . . . . . . . . . . . . . . . . . . . . . . 177
Yuki Matsuda, Dmitrii Fedotov, Yuta Takahashi, Yutaka Arakawa,
Keiichi Yasumoto and Wolfgang Minker
Automated Lexical Analysis of Interviews with Individuals
with Schizophrenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
Shihao Xu, Zixu Yang, Debsubhra Chakraborty, Yasir Tahir,
Tomasz Maszczyk, Yi Han Victoria Chua, Justin Dauwels,
Daniel Thalmann, Nadia Magnenat Thalmann, Bhing-Leet Tan
and Jimmy Lee Chee Keong
Impact of Deception Information on Negotiation Dialog Management:
A Case Study on Doctor-Patient Conversations . . . . . . . . . . . . . . . . . . . 199
Nguyen The Tung, Koichiro Yoshino, Sakriani Sakti
and Satoshi Nakamura
Contents xv

End-to-End Systems
An End-to-End Goal-Oriented Dialog System with a Generative
Natural Language Response Generation . . . . . . . . . . . . . . . . . . . . . . . . 209
Stefan Constantin, Jan Niehues and Alex Waibel
Enabling Spoken Dialogue Systems for Low-Resourced
Languages—End-to-End Dialect Recognition for North Sami . . . . . . . . 221
Trung Ngo Trong, Kristiina Jokinen and Ville Hautamäki

Empathic Dialogue Systems


Human-Robot Dialogues for Explaining Activities . . . . . . . . . . . . . . . . . 239
Kristiina Jokinen, Satoshi Nishimura, Kentaro Watanabe
and Takuichi Nishimura
Virtual Dialogue Agent for Supporting a Healthy Lifestyle
of the Elderly . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
Risako Ono, Yuki Nishizeki and Masahiro Araki
A Spoken Dialogue System for the EMPATHIC Virtual Coach . . . . . . . 259
M. Inés Torres, Javier Mikel Olaso, Neil Glackin, Raquel Justo
and Gérard Chollet
Stitching Together the Conversation—Considerations in the Design
of Extended Social Talk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
Emer Gilmartin, Brendan Spillane, Christian Saam, Carl Vogel,
Nick Campbell and Vincent Wade

Humor in Dialogue Agents


Towards an Annotation Scheme for Causes of Laughter
in Dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
Vladislav Maraev and Christine Howes
Humor Intelligence for Virtual Agents . . . . . . . . . . . . . . . . . . . . . . . . . . 285
Andreea I. Niculescu and Rafael E. Banchs

Chat-Oriented Dialogue Systems


Chat Response Generation Based on Semantic Prediction
Using Distributed Representations of Words . . . . . . . . . . . . . . . . . . . . . 301
Kazuaki Furumai, Tetsuya Takiguchi and Yasuo Ariki
Learning Dialogue Strategies for Interview Dialogue Systems
that Can Engage in Small Talk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
Tomoaki Nakamura, Takahiro Kobori and Mikio Nakano
xvi Contents

Chatbol, a Chatbot for the Spanish “La Liga” . . . . . . . . . . . . . . . . . . . . 319


Carlos Segura, Àlex Palau, Jordi Luque, Marta R. Costa-Jussà
and Rafael E. Banchs
Improving Taxonomy of Errors in Chat-Oriented Dialogue
Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331
Ryuichiro Higashinaka, Masahiro Araki, Hiroshi Tsukahara
and Masahiro Mizukami
Improving the Performance of Chat-Oriented Dialogue Systems
via Dialogue Breakdown Detection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
Michimasa Inaba and Kenichi Takahashi
Automated Scoring of Chatbot Responses in Conversational
Dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357
Steven Kester Yuwono, Biao Wu and Luis Fernando D’Haro
Subjective Annotation and Evaluation of Three Different Chatbots
WOCHAT: Shared Task Report . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
Naomi Kong-Vega, Mingxin Shen, Mo Wang and Luis Fernando D’Haro

Question Answering and Other Dialogue Applications


Detecticon: A Prototype Inquiry Dialog System . . . . . . . . . . . . . . . . . . . 381
Takuya Hiraoka, Shota Motoura and Kunihiko Sadamasa
Debate Dialog for News Question Answering System ‘NetTv’-Debate
Based on Claim and Reason Estimation- . . . . . . . . . . . . . . . . . . . . . . . . 389
Rikito Marumoto, Katsuyuki Tanaka, Tetsuya Takiguchi and Yasuo Ariki
Question-Answer Selection in User to User Marketplace
Conversations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
Girish Kumar, Matthew Henderson, Shannon Chan, Hoang Nguyen
and Lucas Ngoo
A Multimodal Dialogue Framework for Cloud-Based Companion
Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
Matthias Kraus, Marvin Schiller, Gregor Behnke, Pascal Bercher,
Susanne Biundo, Birte Glimm and Wolfgang Minker
CityTalk: Robots That Talk to Tourists and Can Switch Domains
During the Dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411
Graham Wilcock

Author Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419


Part I
Language and Social Context
Understanding
Attention Based Joint Model with
Negative Sampling for New Slot Values
Recognition

Mulan Hou, Xiaojie Wang, Caixia Yuan, Guohua Yang, Shuo Hu


and Yuanyuan Shi

Abstract Natural Language Understanding (NLU) is an important component of


a task oriented dialogue system, which obtains slot values in user utterances. NLU
module is often required to return standard slot values and recognize new slot values
at the same time in many real world dialogue such as restaurant booking. Neither
previous sequence labeling models nor classifiers can satisfy both requirements by
themselves. To address the problem, the paper proposes an attention based joint
model with negative sampling. It combines a sequence tagger with a classifier by
an attention mechanism. The tagger helps in identifying slot values in raw texts and
the classifier simultaneously maps them into standard slot values or the symbol of
new values. Negative sampling is used for constructing negative samples of existing
values to train the model. Experimental results on two datasets show that our model
outperforms the previous methods. The negative samples contribute to new slot values
identification, and the attention mechanism discovers important information and
boosts the performance.

M. Hou (B) · X. Wang · C. Yuan · G. Yang


Center of Intelligence Science and Technology, Bejing University of Posts
and Telecommunications, Bejing, China
e-mail: houmulan@bupt.edu.cn
X. Wang
e-mail: xjwang@bupt.edu.cn
C. Yuan
e-mail: yuancx@bupt.edu.cn
G. Yang
e-mail: yangguohua@bupt.edu.cn
S. Hu · Y. Shi
Beijing Samsung Telecom R&D Center, Bejing, China
e-mail: shuo.hu@samsung.com
Y. Shi
e-mail: yy.shi@samsung.com

© Springer Nature Singapore Pte Ltd. 2019 3


L. F. D’Haro et al. (eds.), 9th International Workshop on Spoken Dialogue
System Technology, Lecture Notes in Electrical Engineering 579,
https://doi.org/10.1007/978-981-13-9443-0_1
4 M. Hou et al.

1 Introduction

Task oriented dialogue system, which has been widely used in a variety of different
applications, is designed to accomplish a specific task through natural language inter-
actions. One of its most important components is Natural Language Understanding
(NLU). NLU aims at collecting information related to the task.
Semantic frames are commonly applied in NLU [11], each of which contains
different slots. One of the goals of NLU is to fill in the slots with values extracted
from the user utterances. In previous work, sequence labeling models are usually used
for slot values recognition. For example, Tur et al. [10] used Conditional Random
Field (CRF) with domain-specific features for the task. With the success of deep
neural networks, Yao et al. [14] proposed a RNN model with Named Entities (NER)
as features. They also used Long Short-Term Memory (LSTM) [13] and some other
deeper models. Ma et al. [4] combined Convolutional Neural Network (CNN), LSTM
and CRF in a hierarchical way, where features extracted by a CNN are fed to a LSTM,
a CRF in top level is used to label slot values.
Nevertheless, only the labeling of the slot values is not enough in some applica-
tions. The slot values labeled in utterances should be normalized to some standard
values for database search. For example, in a restaurant booking system, there are
standard values of slot ‘food’ like ‘Asian oriented’. If a user wondered a restaurant
which serves ‘pan Asian’ food, the system should normalize the ‘pan Asian’ in utter-
ance into the standard value of ‘Asian oriented’ in database. There were two different
ways for addressing this problem. One is two-stage methods. Lefvévre [3] proposed
a 2+1 model. It used a generative model consisted of two parts, namely semantic
prior model and lexicalization model, to determine the best semantic structure and
then treated the normalized slot values as hidden variables to figure it out. Yeh [15]
employed fuzzy matching in Apache Solr system for the normalization. Two-stage
methods are either prone to accumulating errors or too complicated to compute. The
other way is directly mapping an utterance to one of the standard values instead
of identifying the values in raw texts. A lot of classifiers were used for building
the mappings. Bhagat et al. [1] tried several different models including Vote model,
Maximum Entropy, Support Vector Machine (SVM). Mairesse et al. [5] proposed
a two-step method: a binary classifiers was first used to determine if a slot appears
in the utterance or not, and then a series classifiers were used to map the utterance
to standard values of that slot. Mota et al. [7] built different classifiers for different
slots respectively.
There is an important problem in above classification based methods however.
These models failed in dealing with the situation where a slot value out of the standard
value set is mentioned in an utterance. This value should not be classified into any
existing standard values and should be recognized as a new value. To our knowledge,
there is no research on this problem in classification based NLU.
The problem might be thought as one type of zero-shot problems in word sense
or text classification and others. But there is a significant difference between new
slot values and other zero-shot problems. The sense of a new word might be very
Attention Based Joint Model with Negative Sampling for New Slot Values Recognition 5

different from that of other known words. But a new slot value is still a value of
the same slot. It should share some important similarities with other known slot
values. That is the starting point for us to construct training samples for unknown
new values. We first distinguish two different types of samples of the standard values
of a specific slot S. Utterances including any known standard value or its variants of
the slot S are positive samples, and the others are negative ones. We further divide
the negative samples into two types, the first is negative samples of S, i.e. samples
including values of other slots or including no value of any slot, and the second is
negative samples of any known standard values of S. The latter is therefore can be
used to build a classifier (together with positive samples of the standard values of S)
for identifying if an utterance includes a known standard value or a new value of S.
The paper proposes a negative sampling based method to construct samples of the
latter.
Meanwhile, sequence labeling is able to locate slot values in original utter-
ances even if they are unseen in standard value set. The slot values themselves
are also important information for classification. The paper proposes a joint model
of sequence labeling and classification by attention mechanism, which focuses on
important information automatically and takes advantage of the raw texts at the same
time. Sequence labeling here aims at slot-value detection and classification is used
to obtain the standard values directly.
Overall, we propose an attention based joint model with negative sampling. Our
contributions in this work are two-fold: (1) negative sampling for existing values for
a certain slot S enables our model to effectively recognize new slot values; (2) joint
model collaborated by attention mechanism promotes the performance. We evaluate
our work on a public dataset DSTC and a dataset Service from an enterprise. All the
results demonstrate that our model achieves impressive improvements on new slot
values with less damage on other sub-datasets. The F1 score evaluated on new slot
values raises up to 0.8621 in DSTC and 0.7759 in Service respectively.
This paper is organized as follows: Sect. 2 details on our attention based joint
model with negative sampling. We explain experiment settings in Sect. 3, then eval-
uate and analyse our model in Sect. 4. In Sect. 5 we will conclude our work.

2 Attention Based Joint Model with Negative Sampling


(AJM_NS)

We assume that slots are independent of each other so they can be handled separately.
A vocabulary of values for slot S is defined as R S = {Sold } {N E W, NU L L}, where
Sold = {s0 , s1 , ...sk } refers to the set of standard values for which there is some labeled
data in training set. N E W refers to a new slot value. It will be assigned to an utterance
providing a new slot value for slot S which is outside Sold , and NU L L refers to no
value in an utterance. For a user input xi , the aim of the model is to map the xi into
one of values in R S . Since there is no training data for a new slot value (if we have
6 M. Hou et al.

some training samples for a value, it belongs to Sold ), classification based models on
the dataset are unable to address the problem, while sequence taggers need another
step to normalize the labels.
We describe our attention based joint model, followed by the negative sampling
methods.

2.1 Attention Based Joint Model

A sequence tagger and a classifier complement each other. A sequence tagger rec-
ognizes units of a slot value in an utterance, while a classifier map an utterance as a
whole into a slot value. In order to benefit from both of them, we combine them into
a joint model.
Specifically, we adopt the bi-directional LSTM [2] as a basic structure. The output
of each timestep is used to output a slot tag by a softmax operation on a linear layer
as shown in Eq. 1:
sˆt = softmax(Ws h t + bs ) (1)

→ ← −
h t = ( h t , h t ) refers to the hidden state of time t by concatenating the hidden state in
forward and backward direction. In each direction of LSTM, like in forward LSTM,


hidden state h t is a function of the current input and the inner memory, as defined
in Eq. 2

→ −−→ −−→
h t = f ( h t−1 , wt , C t−1 ) (2)
−−→
where wt denotes the input word at time t and C t−1 is the previous cell state. We
compute function f using the LSTM cell architecture in [16]. So as on backward
direction.
The hidden state of the last timestep T is used to output the class label according
to Eq. 3:
ŷ = softmax(Wc h T + bc ) (3)

We further combine them by attention mechanism [13]. Figure 1 illustrates the


procedure (Fig. 1).
Upon attention mechanism, the model automatically focuses on locations of
important information and constructs a context vector H which is defined in Eq. 4.


T
H= αt v t (4)
t

where v t = (et , h t ) concatenates word embeddings and hidden states of LSTM and
αt is defined in Eq. 5.
Attention Based Joint Model with Negative Sampling for New Slot Values Recognition 7

Fig. 1 In this figure, attention based joint model combines sequence tagging and classifying and
adopts attention mechanism for further improvements. Legend in the right corner shows the meaning
of operations

exp(qt )
αt =  T (5)
k exp(qk )

Our model computes qt by an align function in Eq. 6 which is the same way as [9]:

qt = (tanh(Wv t )) h T (6)

It is regarded as a similarity score of the utterance representation h T and the


information v t of each timestep.
Finally we concatenate context vector H and the sentence embedding h T , and
feed it into a softmax layer as shown in Eq. 7 to predict the class label of standard
slot values.
ŷ = softmax(W(H, h T ) + b) (7)

All parameters are learned simultaneously to minimize a joint loss function shown
in Eq. 8, i.e. the weighted sum of two losses for sequence tagging and classification
respectively.

L = γ L tagging + (1 − γ )L classi f ication (8)


1 
N
1 
Ti
L tagging = L(ŝti , sti ) (9)
N i
Ti t
8 M. Hou et al.

1 
N
L classi f ication = L( ŷi , yi ) (10)
N i

γ is a hyperparameter to balance the sequence tagging and classifying module. N in


Eq. 9 refers to the size of training data and Ti is the length of the i-th input. L(·) is
cross-entropy loss function.

2.2 Negative Sampling

Model fails in recognizing new slot values without training data for them as men-
tioned before. If we regard all the samples for new slot values of a specific slot as
the negative samples of existing ones, construction of samples for new slot values
can then convert to the construction of negative samples of old ones.
As mentioned in Sect. 1, a new slot value is still a value of the same slot. It should
share some important similarities with other known slot values. Here we think the
similarities are hidden in contexts of the value, i.e. the contexts are shared among
different values of a same slot. It is therefore a possible way to construct a negative
sample by just replacing the slot values in a positive sample with a non-value. But
there are so many choices for non-value, how to choose a proper one?
Mikolov et al. [6] have already used negative sampling in CBOW and Skip-gram
models. They investigated a number of choices for distribution of negative samples
and found that the unigram distribution U (wor d) raised to the 3/4rd power (i.e.,
U (wor d)3/4 /Z ) outperformed significantly the unigram and the uniform distribu-
tions. Z is the normalization constant and U (wor d) is the word frequency in another
word, which is calculated by U (wor d) = count (wor d)/ |Data|. We use the same
method but leave the word frequency alone. In our work a negative sample is a com-
plete slot value that sometimes consists of several words, different from the negative
samples of a single word in [6]. That results in repeating sampling until a segment
of the same length as the existing value is formed. Figure 2 shows the construction
of a negative example for Service dataset.

Fig. 2 Negative sampling for service dataset. Lower part is a translation of the example
Attention Based Joint Model with Negative Sampling for New Slot Values Recognition 9

3 Experiments Setting

3.1 Dataset

We evaluate our model on two dataset: Dialogue State Tracking Challenge (DSTC)
and a dataset from an after-sale service dialogue system of an enterprise (Service).
DSTC is an English dataset from a public contest [12] and we use DSTC2 and
DSTC3 together. It collects 5510 dialogues about hotels and restaurants booking.
Each of the utterance in dialogues gives the standard slot values, according to which
slot tags can be assigned to word sequence. Based on the independency assumption,
we build datasets for each slot: keep all B- or I- tags of the slot labels and reset the
rest to ‘O’. However we find out that not all slots are suitable for the task, since there
are too few value types of the slot. At last we choose the dataset for slot ‘food’ only
in our experiments.
Service is a Chinese dialogue dataset which is mainly about consultation for cell
phones and contains a single slot named ‘function’. It has both sequence tags and
slot values on each utterance.
We divide two datasets into training, dev and test set respectively, and then con-
struct some negative samples into training set for both of them. All of the utterances
corresponding to infrequent slot values in training set are put into test set to form
corpus of new slot values. These values thus have no samples in training data. Table 1
shows the statistics of the final experimental data and Table 2 tells about the diversity
of slot values.

Table 1 Statistics of two dataset


Corpus DSTC Service
Train Dev Test Train Dev Test
Original data Old 2805 937 917 3682 514 1063
New 0 113 275 0 15 64
Null 2244 840 953 427 64 109
Negative samples 561 0 0 736 0 0
Overall size 5610 1890 2145 4845 593 1236

Table 2 Value types


Corpus DSTC Service
Train Dev Test Train Dev Test
Old 66 64 65 80 55 67
New 0 21 21 0 13 44
10 M. Hou et al.

3.2 Evaluation Measurements

We take weighted F1 score as the evaluation criterion in our experiments. It is defined


as in Eqs. 11 and 12.
 N
F1 = ωi F1si (11)
i

with
n si Ps × Rsi
ωi = , F1si = 2 i (12)
n Psi + Rsi

where n refers to the size of the test set and n si denotes the size of class si . P and R
is precision score and recall score defined in [8].
We also evaluate on the sub-dataset of old values by Eq. 13.


k
F1old = ωiold F1si (13)
i=0

n
where ωiold = n old
si
.
For sequence tagging we still consider F1 score as criterion which can be calcu-
lated by running the official script conlleval.pl1 of CoNLL conference.

3.3 Baseline

There are no previous models and experimental results reported especially on new
slot values recognition. We compare our model to existing two types of NLU methods
for the task.
(1) The pipeline method:labeling the words with slot value tags first and then
normalizing them into standard values. Here, a bi-directional LSTM as same as that
in our model is used for tagging, and the fuzzy matching2 is then used to normalize
extracted tags like that in [15]. The model is denoted by LSTM_FM.
(2) The classification: classifying the utterance to standard values directly. A bi-
directional LSTM is used to encode user input, a full-connected layer is then used
for the classification. The model is denoted by LSTM_C.

1 https://www.clips.uantwerpen.be/conll2000/chunking/output.html.
2 http://chairnerd.seatgeek.com/fuzzywuzzy-fuzzy-string-matching-in-python.
Attention Based Joint Model with Negative Sampling for New Slot Values Recognition 11

3.4 Hyperparameters

We adopt bi-directional LSTM as the basic structure. Hyperparameter γ is 0.1. The


longest input is 30, size of LSTM cell is 64, and dimension of word embedding is
100. We use minibatch stochastic gradient descent algorithm with Adam to update
parameters. Learning rate is initialized as 0.005. Each batch keeps 512 pieces of
training data. We choose the model performs best in dev set as the test one.

4 Result and Analyses

4.1 Comparisons Among Different Models

We evaluate our model on two dataset described in Sect. 3.1. Our model can output
both classification results of a utterance and the labeled tags in a utterance. Tables 3
and 4 shows the results of classification and labeling respectively.
As we can see in Table 3, our model outperforms both baseline models signifi-
cantly in classification task. It achieves 13.44 and 16.17% improvements compared
to LSTM_FM and LSTM_C model on DSTC dataset, and achieves 8.55 and 5.85%
improvements on Service dataset. Especially, it shows big advantage on new slot
values recognition, where the F1 scores achieve at least 20% raises on both DSTC
and Service data.
Similar to the performance in the classification, our model also achieves best
results in slot value tagging as we can see in Table 4. It performs significant better
than the pipeline method, especially for the new value. We also give the tagging results
of LSTM_FM trained by adding negative samples used in our model (denoted by
LSTM_FM_NS in Table 4). We find negative samples are helpful to NEW slot values
significantly, but they hurt the performance of old values. We give more details of
negative samples and attention mechanism in our model and baseline models in next
subsection.

Table 3 Classification results of different models


DSTC Service
All NEW Sold NULL All NEW Sold NULL
LSTM_FM 0.8491 0.3063 0.9670 0.8923 0.8981 0.5693 0.9320 0.5693
LSTM_C 0.8290 0.0000 0.9249 0.9761 0.9210 0.0000 0.9720 0.9643
AJM_NS 0.9632 0.8621 0.9738 0.9822 0.9749 0.7759 0.9881 0.9633
(ours)
12 M. Hou et al.

Table 4 Tagging results of different models


DSTC Service
All NEW Sold All NEW Sold
LSTM_FM 0.8546 0.2363 0.9837 0.8850 0.2615 0.9269
LSTM_FM_NS 0.8289 0.2844 0.9709 0.8386 0.4853 0.8655
AJM_NS (ours) 0.9024 0.5684 0.9946 0.9132 0.3399 0.9573

Table 5 Comparison inside the model with F1 scores for classification


DSTC Service
All NEW Sold NULL All NEW Sold NULL
Full (AJM_NS) 0.9632 0.8621 0.9738 0.9822 0.9749 0.7759 0.9881 0.9633
Attention only (JM_NS) 0.9515 0.8129 0.9739 0.9699 0.9700 0.7207 0.9862 0.9585
NS only (AJM) 0.8247 0.0000 0.9426 0.9492 0.9234 0.0000 0.9761 0.9511

Table 6 Confusion matrix of DSTC


DSTC
NEW Sold NULL NEW Sold NULL
NEW 0 184 91 NEW 225 33 17
Sold 0 916 1 ⇒ Sold 9 908 0
NULL 0 9 944 NULL 13 4 936

4.2 Analyses

In order to analyze our model, we compare it to the model dropping out attention
mechanism only and the other dropping negative samples only. We refer to the former
model as JM_NS and the latter as AJM.
From Table 5 we can find out that the one dropping out negative samples (AJM)
failed in dealing with new slot values recognition. It shows that the negative sampling
is the key for the success in new slot values recognition. The negative samples actually
enables the model to distinguish old and new slot values. For more details, the changes
of confusion matrices are shown in Tables 6 and 7. The left part of ‘⇒’ in the table is
the confusion matrix of the model without negative samples(AJM), and the right part
is from the original full model (AJM_NS). With the training of negative samples,
classification results related to NEW value change better significantly, while change
little on other classes, i.e. negative samples bring less damage to other classes.
We also add same negative samples for training other models. The result in Table 8
shows that LSTM_C_NS(LSTM_C with negative samples) now achieve good per-
formance of recognizing new slot values. As for LSTM_FM_NS, the F1 score drops
a lot for old values while for new slot values it raises up on the contrary. It shows
that, although negative samples still work, they damage other classes significantly
Attention Based Joint Model with Negative Sampling for New Slot Values Recognition 13

Table 7 Confusion matrix of Service


Service
NEW Sold NULL NEW Sold NULL
NEW 0 55 9 NEW 45 17 2
Sold 0 1063 0 ⇒ Sold 4 1057 2
NULL 0 2 107 NULL 3 1 105

Table 8 Classification results based on negative samples


DSTC Service
All NEW Sold NULL All NEW Sold NULL
LSTM_FM_NS 0.8572 0.3536 0.9286 0.9241 0.8642 0.6203 0.9009 0.6488
LSTM_C_NS 0.9543 0.8261 0.9637 0.9822 0.9684 0.7103 0.9825 0.9815
JM_NS 0.9515 0.8129 0.9739 0.9699 0.9700 0.7207 0.9862 0.9585
AJM_NS 0.9632 0.8621 0.9738 0.9822 0.9749 0.7759 0.9881 0.9633

Fig. 3 Comparison between the full model (AJM_NS) and the one dropping out attention mecha-
nism (JM_NS). The heatmap in full model is the visualization of weights for different words. The
deeper color means a larger weight

in pipeline model. We can also find out that our model AJM_NS still beats the rest
models on the whole dataset even if all of them use negative samples.
When we abandon attention mechanism (JM_NS), the model is slightly inferior
to the full one (AJM_NS), i.e. the attention mechanism can further improve the
performance by focusing on the important subsequences. Since it introduces the
original word embeddings at the same time, it corrects some mistakes in the model
dropping out attention mechanism (JM_NS) in which the final label is wrongly
classified even with correct sequence tags. We visualize a sample of attention in
Fig. 3.

5 Conclusion

In lots of industrial or commercial applications, it is necessary for a NLU module


to not only fill the slot with predefined standard values but also recognize new slot
values due to the diversity of users linguistic habits and business update.
14 M. Hou et al.

The paper proposes an attention based joint model with negative sampling to
satisfy the requirement. The model combines a sequence tagger with a classifier
by an attention mechanism. Negative sampling is used for constructing negative
samples for training the model. Experimental results on two datasets show that our
model outperforms the previous methods. The negative samples contributes to new
slot values identification, and the attention mechanism improves the performance.
We may try different methods of negative sampling to further improve the perfor-
mance in following works, such as introducing prior knowledge. At the same time,
scenario of multiple slot in an utterance will also be explored as it happens a lot in
daily life.

References

1. Bhagat R, Leuski A, Hovy E (2005) Statistical shallow semantic parsing despite little training
data. In: Proceedings of the Ninth international workshop on parsing technology, pp 186–187.
Association for Computational Linguistics
2. Graves A, Jaitly N, Mohamed AR (2013) Hybrid speech recognition with deep bidirec-
tional LSTM. In: 2013 IEEE Workshop on Automatic Speech Recognition and Understanding
(ASRU), pp 273–278. IEEE
3. Lefévre, F (2007) Dynamic Bayesian networks and discriminative classifiers for multi-stage
semantic interpretation. In: IEEE International Conference on Acoustics, Speech and Signal
Processing, ICASSP 2007, vol 4, pp IV–13. IEEE
4. Ma X, Hovy E (2016) End-to-end sequence labeling via bi-directional LSTM-CNNS-CRF.
arXiv:1603.01354
5. Mairesse F, Gasic M, Jurcícek F, Keizer S, Thomson B, Yu K, Young S (2009) Spoken lan-
guage understanding from unaligned data using discriminative classification models. In: IEEE
International Conference on Acoustics, Speech and Signal Processing, 2009. ICASSP 2009,
pp 4749–4752. IEEE
6. Mikolov T, Sutskever I, Chen K, Corrado GS, Dean J (2013) Distributed representations of
words and phrases and their compositionality. Advanc Neural Informat Process Syst 3111–3119
7. Pedro Mota Luísa Coheur AM (2012) Natural language understanding as a classification pro-
cess: report of initial experiments and results. In: INForum
8. Perry JW, Kent A, Berry MM (1955) Machine literature searching x. machine language; factors
underlying its design and development. J Associat Informat Sci Technol 6(4):242–254
9. Seo M, Kembhavi A, Farhadi A, Hajishirzi H (2016) Bidirectional attention flow for machine
comprehension. arXiv:1611.01603
10. Tur G, Hakkani-Tür D, Heck L, Parthasarathy S (2011) Sentence simplification for spoken
language understanding. In: 2011 IEEE International Conference on Acoustics, Speech and
Signal Processing (ICASSP), pp 5628–5631. IEEE
11. Wang YY, Deng L, Acero A (2011) Semantic frame-based spoken language understanding.
Spoken language understanding: systems for extracting semantic information from speech, pp
41–91
12. Williams J, Raux A, Ramachandran D, Black A (2013) The dialog state tracking challenge. In:
Proceedings of the SIGDIAL 2013 conference, pp 404–413
13. Yao K, Peng B, Zhang Y, Yu D, Zweig G, Shi Y (2014) Spoken language understanding
using long short-term memory neural networks. In: 2014 IEEE Spoken Language Technology
Workshop (SLT), pp 189–194. IEEE
14. Yao K, Zweig G, Hwang MY, Shi Y, Yu D (2013) Recurrent neural networks for language
understanding. In: Interspeech, pp 2524–2528
Another random document with
no related content on Scribd:
één woord, de vermaaken die te Muiderberg genoten worden zijn te talrijk
om ze allen te beschrijven, en te vol gewoel om er een wèl geordend
tafreel van te ontwerpen; allen helpen zij intusschen, zo als wij reeds
zeiden, den bloei van het plaatsjen niet weinig bevorderen.

’T is omtrent deeze plaats, omtrent dit dorpjen, dat, naar ’t gevoelen van
eenigen, Graaf Floris de Vijfde, door de zamengezworenen is
omgebragt; (zie onze beschrijving van Naarden, Art. Geschiedenissen,) ’t
geen anderen, doch verkeerdlijk, willen, dat op het Muiderslot zoude
geschied weezen, ’t geen echter van de beste Historieschrijvers wordt
tegengesproken, in navolging van welken de Puik-dichter Antonides van
der Goes, in zijnen Y-stroom, bladz. 108, ook zegt:

Toen Velzen, zoet op wraak, met zijne vloekgenooten,


Den Graaf, zijn’ wettig Vorst, den dolk in ’t hut dorst stooten,
En Gooiland verwen met het bloed van zijnen Heer.

Woorden die allerduidelijkst te kennen geeven dat, volgends [4]den Dichter,


’s Graaven bloed den Gooischen bodem, (niet den grond van deeze of
geene kamer in het Muiderslot,) geverwd heeft.

NAAMSOORSPRONG.

De naamsoorsprong van Muiderberg, wordt voegelijk afgeleid, (ook is er


geene andere bedenking over te maaken,) van de daar nabij gelegene
stad Muiden, en de naastaanliggende hoogte; welke, voor zo verre die
waarop het dorp ligt betreft, en met betrekking tot de doorgaande vlakke
eigenschap van ons Land, den naam van berg verkregen heeft, als vrij
hoog zijnde, en boven allen die rondsom liggen uitsteekende; deeze
hoogte, of berg, nu (bij Muiden liggende,) zal dan den naam van berg van
Muiden of Muiderberg verkregen hebben, en voords het Dorp ook met dien
naam benoemd weezen.

STICHTING en GROOTTE.
Wie Muiderberg eigenlijk gesticht of aangelegd zoude hebben, daarvan
zijn geene bescheiden voorhanden: oud moet het zekerlijk zijn, uit
aanmerkinge van den reeds gemelden Giftbrief van Graave Willem van
Henegouwen, geschreven in den jaare 1324; want daarin wordt het, gelijk
wij gezien hebben, reeds gespeld.

Wat de grootte betreft, volgends de lijsten der verpondingen van den jaare
1632, stonden er toen 34 huizen, doch honderd jaaren laater, in 1732,
bedroeg dat getal niet meer dan 28 huizen; weshalven het in de gezegde
honderd jaaren, 6 huizen verminderd is; thans zijn er weder 6 minder,
naamlijk slechts 22, het welk zeer ligtlijk het geval van dergelijke, schoon
bloejende, dorpjens kan worden, want die bloei bestaat gemeenlijk in niet
meer dan in eene genoegzaame broodwinning der bewooneren, ofschoon
het daarom anderen, elders woonende, niet geraaden zij, zig aldaar met er
woon te komen nederslaan, alzo zij welligt alles wat zij nog hadden
verteerd zouden hebben, [5]aleer zij gelegenheid kreegen om door hun
toedoen den bloei des dorpjens te vermeerderen, en derhalven zig zelven
in eenen bloejenden staat te bevinden.

Men schat het getal der inwooneren op omtrent 200, die, uitgenomen
eenige weinige Roomschgezinden, allen van den Gereformeerden
Godsdienst zijn.

Het schatbaar land onder het district van Muiderberg behoorende, wordt
begroot op niet meer dan honderd en vijftig morgen.

Een wapen heeft dit dorpjen niet.

KERKLIJKE en GODSDIENSTIGE GEBOUWEN.

Dit Artijkel van ons plan betreffende kunnen wij, het tegenwoordige
dorpjen aangaande, niet anders noemen dan de kerk, want Wees- of
andere Gods-dienstige Gestichten zijn er niet voorhanden: de Weezen
worden er bij de inwooners besteed.
Van binnen is de kerk zeer zindelijk, doch ook zeer eenvoudig, hebbende
volstrekt niets dat men kan zeggen een cieraad te weezen; ook is er geen
orgel in.

Derzelver vertooning van buiten, maakt zeer geloofwaardig het geen men
er van aangetekend vindt, naamlijk dat het nog de capel zoude zijn welke
de Roomschen in vroegere eeuwen aldaar gehad hebben; zij heeft in alles
de gedaante van een capel, vooral van vooren; men gaat tot den ingang,
(er is ook maar één ingang aan) door een laantjen van boomen, waar
achter het bovenste gedeelte van de kerk zig verbergt: men wil dat dit
gebouw gesticht zoude weezen, door den reeds meergemelden Graaf
Willem van Henegouwen, de derde van dien naam; doch, en het geen
van zelf spreekt, als eene capel, welke bij de Reformatie van binnen tot
het oefenen van den Gereformeerden Godsdienst is toebereid.

Thans staat op het gebouw een vierkante toren, zijnde van boven geheel
plat; evenwel is dezelve zodanig niet altoos geweest; er heeft, zelfs nog in
de tegenwoordige eeuw, [6]een spits op gestaan, doch hetzelve is er door
een’ stormwind afgewaaid, en sedert is er geen ander spits op gezet.

Niettegenstaande de gemeente te Muiderberg altijd slechts bestaan hebbe


uit omtrent 50 ledemaaten, heeft zij echter sinds het jaar 1687, haar eigen
Predikant, zijnde sedert 17 Augustus, van den jaare 1783, de Wel-Eerw.
en bij zijne gemeente zeer geliefde Heer, Kristiaan Johan Fruitier,
behoorende onder de Classis van Amsteldam.

De eerste Predikant alhier was Nicolaas Bassecour, bevestigd den 17


Augustus 1687, en hem werdt den 13 October van het zelfde jaar, één
Kerkraad, één Ouderling, en één Diacon toegevoegd, door een commissie
uit de Classis van Amsteldam: in het jaar 1698, is zijn Wel-Eerw. beroepen
te Schiedam—Voords hebben de volgende Predikanten alhier gestaan:

Geerard Midlum, is bevestigd den 27 April 1698, en beroepen te ’s


Graaveland 1706.

Petrus de Bye, is bevestigd den 30 Mei 1706, en hier overleden, den 14


Julij 1726.
Roeland van Thiel, is bevestigd den 2 Febr. 1727, en heeft van zijnen
dienst vrijwillig afgestaan 1747.

Jan Rijser, is bevestigd den 28 Jan. 1748, en emeritus geworden in Sept.


1780.

Carolus Pantekoek, is bevestigd den 29 April 1781, en op collatie


vertrokken naar Niërvaart, gezegd de Klundert.

De Pastorie is een vrij goed, en aangenaam gelegen gebouw.

Het Schoolhuis voldoet mede allezins aan deszelfs oogmerk.

WERELDLIJKE GEBOUWEN.

Onder dit artijkel kunnen wij niet anders brengen, dan het Rechthuis, dat
voor 3 jaaren een ruime Herberg was; doch sedert in een schoone lusthof
is veranderd. [7]

KERKLIJKE REGEERING.

Deeze bestaat sedert den 14 November, 1687, uit den Predikant, 2


Ouderlingen en 2 Diaconen.

Er zijn ook 2 Kerkmeesteren, die, in gevalle van afsterven, door Schout en


Schepenen verkozen worden.

WERELDLIJKE REGEERING.

Deeze is als op de andere dorpen van Gooiland: de Hooge Vierschaar


wordt er gespannen door den Bailluw en de Schepenen van Gooilands
Hoofdstad, Naarden, de Civile rechtbank wordt gespannen door Schout en
Schepenen, zijnde deeze laatsten vijf in getal.

Voords zijn alhier mede twee Buurtmeesters en twee Kerkmeesters: van


den eerstgemelden gaat jaarlijks één af.
De Schepens worden verkozen door den Bailluw, uit een nominatie van
een dubbeld getal, gemaakt door den Schout en Buurtmeesters: aan de
nieuw verkozene Schepenen staat de verkiezing van den Buurtmeester,
die voor dat jaar aankomt; zie boven.

Voorrechten heeft Muiderberg, voor zo verre ons bewust is, niet.

De

BEZIGHEDEN

Der bewooneren, zijn meestal de landbouw, waartoe zij, gelijk wij hiervoor
reeds zeiden, goede gelegenheid hebben: het zaajen van boekwijt en
rogge, en het pooten van aardappelen, gaat er zeer sterk: voords vindt
men er eenigen van die werklieden welken in de burgerlijke zamenleving
volstrekt onontbeerelijk zijn.

Wat aangaat de [8]

GESCHIEDENISSEN,

Van Muiderberg, de beschrijving van deezen vereischt geene breede


plaats: in de oorlogsrampen van Muiden en Naarden, heeft het zeer
waarschijnelijk zijn deel gehad, ofschoon wij desaangaande niets
bijzonderlijks vinden aangetekend; alleenlijk is het optemaaken uit den aart
dier rampen, zodanig zijnde, dat zij zig maar zeldzaam, of liever nooit, aan
een klein plekjen gronds bepaalen, maar altoos eenen ruimen omtrek
inneemen; de bewerkers dier rampen zijn Vorsten, deezen zegt men, niet
ten onrechte, schoon tot hunne schande, hebben lange armen, en zulks
wordt in tijden van oorlog met nadruk gevoeld; als hunne armen gewapend
zijn, rijken hunne zwaarden mijlen ver; en slaat men het oog op hunne
laaghartige huurelingen, die vijanden van alle menschlijkheid, zeker, dan is
het nog minder te bewonderen dat de rampen des oorlogs, zig nimmer bij
een klein pleksken gronds bepaalen; de gezegde vorsten-slaaven, zijn
over het algemeen losbandige booswichten, uitgehongerde raaven, die
onder den dekmantel van rechten des oorlogs, hunne harten met
gruwelen, en hunne maagen met geroofde beeten vullen, gelijk zij ook niet
zelden hunne beestachtige lusten voldoen ten koste van de eer veeler
braave vrouwen en maagden—is er immer een tijd geweest waarin zulks
dagelijks ondervonden wordt, ’t is de tijd dien wij beleeven; door geheel
Europa woedt en plundert de schenzieke en hoogst verachtelijke
soldaat.… doch welhaast wordt veelligt de dag geboren, (sommigen
meenen zelfs de eerste morgenschemering daarvan reeds te bespeuren,)
waarop alle vorst, alle soldaat.… dan op dien toon voordgaande, zouden
wij de eigenlijke paalen van ons plan overschreiden. [9]

Door het vuur heeft Muiderberg, voor zo verre wij hebben kunnen
naspooren, nooit veel geleden; ook niet door het water; want ofschoon het
nabij de zee gelegen zij, heeft de goeddoende en altijd zorgende Natuur
het dorpjen, door middel van vrij hoog duin tegen de woede van dat
element beveiligd.

„In den jaare 1673 hadden de Franschen,” dus luidt een gedeelte der
historie van dit dorp, „zig op Muiderberg verschanst en batterijen
opgeworpen tegen die van Muiden, welke stad zij toen onder hunne magt
hoopten te krijgen; zij werden echter van daar verdreven, door
verscheidene uitleggers op de Zuiderzee, die van Amsteldam gezonden
werden, en door vlotschuiten met kanon waarvan men drijvende batterijen
maakte, die hen van de vaart tusschen Muiden en Naarden zo
benaauwden, dat zij op den 6 Junij van ’t gemelde jaar opbraken, en
hunne onderneemingen lieten vaaren.”

Bij de omwending in onzen burgerlijken staat, heeft Muiderberg zeer veel


geleden: door de Pruissen zijn alle buitenplaatsen grootlijks, en Rustrijk,
die van den Heere Abbema, ook de Pastorij, geheel en al geplunderd:
verscheide weken hebben veele oude lieden en kinderen zig in de open
lucht moeten ophouden, om derzelver schreeuwende mishandelingen te
ontvlieden: wij mogen intusschen niet vergeten aantetekenen dat de
ingezetenen aldaar meest de Patriotsche partij toegedaan waren, en zij
zig, op last der Heeren Staaten van Holland en Westvriesland, ook in den
wapenhandel geoefend hebben.
Onder de

BIJZONDERHEDEN,

Van dit dorpjen, behooren twee kerkhoven, het eene reeds in de


voorgaande eeuw aangelegd voor de Hoogduitsche Jooden, van welken
hier doorgaands honderd in het jaar begraven worden; het andere is,
sedert een jaar aangelegd, voor de Lutherschen [10]van ’t Oude licht; doch
tot heden toe heeft niemand hier eene rustplaats voor zijn overschot
verkozen.

Het voornaame logement waartoe de voorgemelde buitenplaats van den


Heere Abbema gemaakt is, verdient mede eene bijzonderheid genoemd te
worden, uit aanmerking van de zonderling grootsche aanleg, (waarvan
mogelijk in geheel het Vaderland, geen voorbeeld voorhanden is,) zo wel
als van de kleinte van het dorpjen, alwaar dezelve gevonden wordt; doch
wanneer men aanmerkt dat de Grooten reeds vóór dien aanleg gewoon
waren zig op Muiderberg te komen verlustigen, en ook dat er verscheidene
buitenplaatsen rondsom liggen, allen welken geduurende het
zomersaisoen bewoond worden, dan komt de verkiezing van dien aanleg
niet zo geheel bijzonder voor; men konde tog vooraf op voldoend vertier
staat maaken, om reeden van hetgeen wij zo even zeiden; want dat vertier
moet ook alleen slechts van de Grooten komen, de burger schrikt op het
zien van den prachtigen aanleg, zodra hij het woord Logement er voor
leest: vooral is deeze plaats eene bijzonderheid, wegens de
aanmerkenswaardige echo die men aldaar heeft, en welke veele
vreemdelingen derwaards lokt; de Edele Heer Willem Hooft, te
Amsteldam, heeft er den zeer geleerden Heere Martinet, nagenoeg de
volgende beschrijving van medegedeeld—men vindt er een ouden muur in
een halve cirkelronde gedaante, zeven voeten hoog gebouwd, met een
schuinse rollaag, die men op één voet mag rekenen; de middenlijn
deszelven beloopt op honderd en negen voeten binnenswerks: vijftien
voeten ten noorden achter deezen muur staat eene hegge, die twee of drie
voeten hoog boven denzelven uitsteekt, en eenige roeden verder vindt
men hooge boomen; wanneer men nu vóór deezen muur gaat staan, dan
ziet men tusschen beiden eenen platten beplanten grond, en achter zig
heeft men eenen anderen halven cirkel van latwerk, waartegen eenig
geboomte is opgeleid, zijnde de afstand van het middenpunt des muurs tot
dat van het [11]latwerk, van honderd twee- en twintig en een halven voet
Amsteldamsche maat.

Indien men zig nu plaatst op den afstand van drie- en- vijftig voeten van
het middenpunt des muurs, en een ander zeventien voeten ten westen
bezijden den eerstgemelden gaat staan, en dan zacht of hard, geheele
versen spreekt, beantwoordt de echo dezelven, niet achter elkander, maar
elk afzonderlijk, één voor één: dan, het verwonderlijkste van alles is, dat
de stem of de echo niet schijnt terug te komen van den muur, maar uit den
grond, zeer juist alle woorden nabaauwende.

Deeze echo is aldaar ontdekt voor bijna zeventig jaaren, toen de Heer
Homoet eigenaar dier plaatse was, en bij gelegenheid dat men eene
ligusterhegge uitroeide: intusschen is het zeker, dat in het Vaderlandsch
Treurspel, Gerard van Velzen, in het jaar 1613 in ’t licht gegeven, reeds
gesproken wordt van het verstoord gebeente van dit cirkelrond, en van de
echo, bij gevolg is deeze muur, (waartoe gemaakt weet men niet, mogelijk
tevens tot eene begraafplaats,) en dus ook deeze overschoone echo, al
vóór honderd een- en- dertig jaaren, bekend geweest, die daarna in het
vergeetboek geraakt kan zijn, toen deeze hofstede, uit de eene hand in de
andere overging, tot dat men, de ligusterhegge uitwerpende, dezelve
toevallig ontdekte.

REISGELEGENHEDEN.

Deezen zijn als die van Muiden, want van Amsteldam met de schuit tot
daar gekomen zijnde, vaart men met de Naarder schuit tot de
Hakkelaarsbrug, alwaar men uitstapt om verder naar Muiderberg te
wandelen—Terug gaat men weder, of naar Muiden, of naar de
Hakkelaarsbrug voornoemd, en zo verder op Amsteldam.

’T is voor een vaderlander nog al niet onaangenaam, aan [12]gezegde brug


te moeten uitstappen, alzo hij aldaar vergast wordt op het zien van de
Stolp, de landlijke retraite, van den nu zaligen onwaardeerbaaren
Burgervader Hendrik Hooft Danielsz., nog het voorwerp van aller
braaven achting, en die op dat buitenverblijf zijnen hoogen ouderdom
sleet, onder de aangename streelingen van een voldaan geweeten, niet
alleen, maar ook van de hoop, van vóór zijn’ dood zijn vaderland, en met
nadruk zijne geliefde Amstelstad nog eenmaal gelukkig te zullen zien.

LOGEMENTEN,

Deeze zijn geene anderen dan de reeds gemelde plaats van den Heere
Abbema; voords zijn er nog twee herbergen van mindere rang. [1]
[Inhoud]
De stad Weesp.
Zo lang de Zilvren VECHT uw boorden blyft besproeien,
O WESOP! en Natuur u met haar schoon vereert.
Zo lang de Koopmanschap in Nederland zal bloeien;
GENEVER, en door Oost en Westen word begeerd.

Zo lang de Naneef TROUW op hogen prys zal stellen,
Hoort Gy, MYN VADERSTAD! uw naam met blydschap spellen.

B. P.—
DE
S TA D
WEESP.

Onder de geene stem in Staat hebbende Steden van Holland, is Weesp


geenzins eene der geringste, zo wegens derzelver oudheid,
vermaardheid als vermakelijke ligging aan de Rivier de Vecht; een half
uur ten Zuidwesten Muiden; omtrent twee uuren ten Westen Naarden;
ruim twee uuren ten Zuidoosten Amsteldam, en ruim vijf uuren ten
Noorden Utrecht.

NAAMSOORSPRONG.

Bij de Geschiedschrijvers vind men wegens den Naams-oorsprong niets


zekers geboekt. Dat deeze Stad haren naam van de Usipeten
ontleenen zoude, luid al te fabelachtig, om daar aan geloof te slaan. Dat
zij dezelve aan eenen Here de Wesopa, die aldaar een Kasteel, van
dien naam, zou gesticht hebben, verschuldigd is, is even onzeker, en
dat zij om haren geduurigen kloekmoedigen tegenstand door haare
vijanden, leenspreukig, Wespe of Wispe zoude genoemd zijn, hier voor
is geen’ den minsten grond te vinden: ’t zij ons genoeg dat er in Holland
een Steedje is, dat Wezop of Weesp genoemd word, bij welke laatste
benaming het thans allermeest bekend is.

STICHTING en GROOTTE.

Hoewel men den tijd der Stichting dezer Stad met geene zekerheid
bepalen kan; veel min of dezelve altijd met vestingen omringd of bevest
is geweest; kan men echter bewijzen dat zij in den Jaare 1131 reeds
bekend was, als blijkt uit zekeren brief van Andreas den
vijfentwintigsten Bisschop [2]van Utrecht, waarin van bovengemelden
Hero gewaagd word. In de handvest van Hertog Willem van Beieren in
’t Jaar 1355, word van Weesp het allereerst melding gemaakt, als van
eene Stad, voorzien met poorten en wallen, en hare Burgers Poorters
genoemd.

De Stad is zeer ruim en luchtig gebouwd en heeft verscheidene


straaten, die zeer wél betimmerd zijn; van het Zuiden tot het Noorden
doorsneden van de stroomende Rivier de Vecht, waar aan een
Schutsluis ligt, die in een Graft uitlopende, het grootste gedeelte der
Stad wederom in tweeën deelt; terwijl het zuiderdeel met drie Graften
voorzien is, die allen in de laatstgenoemde hunne inwatering hebben.—
Volgends de jongste beschrijving beloopt het getal der Inwooners op
bijkans 2800 menschen, woonende in omtrent 500 huizen, die wederom
in ruim 730 woningen verdeeld zijn. Uit oude tekeningen en
beschrijvingen blijkt het, dat Weesp voorheen met steenen wallen is
omgeven geweest, welker grondslagen men, bij gelegenheden, noch
ontdekken kan, en waar van men noch de overblijfsels ziet aan de
Muiderpoort, de Waag en den zogenaamden Olijmolen, welke
gebouwen zekerlijk voor een gedeelte als rondeelen der oude
vestingwerken moeten beschouwd worden: verval en de uitleggingen
der Stad hebben derzelver afbraak noodzakelijk gemaakt.—
Tegenwoordig is de Stad alleen aan haar Oost en Zuidelijk gedeelte met
aarde bolwerken voorzien, die naar de regelen der hedendaagsche
Vestingbouwkunde opgeworpen zijn. Behalve de andere uitgangen,
heeft deeze Stad drie poorten, namelijk, de Muider, Naarder of ’s
Gravelandsche, en Utrechtsche poort; de eerste is een oud gebouw, in
wiens voorgevel het Keizerlijke wapen staat uitgehouwen, waar onder
het Jaargetal 1552: de twee laatste zijn in den Jaare 1676 gebouwd, en
van eenen ordentlijken aanleg.

’T W A P E N .

Weesp heeft twee Wapens: te weeten het Oude en Nieuwe. Het oude
verbeeld een Kerk, met een’ grooten toren aan den Voorgevel en een’
kleiner’ in de midden: de figuur heeft veel [3]overeenkomst met het
tegenwoordig Kerkgebouw. Het nieuwe is een zilveren paal op een
blaauw veld. Het eerstgenoemde word noch ter bezegeling van brieven
of decreeten gebruikt.

KERKLIJKE en GODSDIENSTIGE GEBOUWEN.

De groote Kerk, waarin de Gereformeerden hunnen Godsdienst


oefenen, is, volgends Jacobus de la Torre, gesticht, of ten minsten
voltooid, in den Jaare 1462, wanneer zij, naar het Roomsch
Kerkgebruik, aan St. Laurentius wierd toegewijd. Het is een schoon,
lang en luchtig Gebouw, pronkende met eenen spitsen toren, in wiens
Koepel een welluidend Klokkenspel hangt, in 1672 door den
vermaarden Petrus Hemoni vervaardigd. Op het Choor is noch een
klein torentje. Dit Gesticht rust binnenwerks op 18 pijlaaren, zijnde
rondom de meeste, de Predikstoel, de Gestoeltens der Regeering en
anderen geplaatst.—Het Orgel, in 1592 gemaakt, heeft, naar den tijd
waarin het zelve vervaardigd is, geen onaangenaam geluid, en word
met deuren gesloten.—In het Choor, dat met een fraai koperen hek van
de Kerk is afgescheiden, vind men een’ kleineren Preêkstoel,
voormaals gebruikt, wanneer de promotie der Latijnsche Schooljeugd
geschiedde. De Gereformeerde Gemeente word bediend door twee
Leeraars, Leden der Classis van Amsteldam: het tractement van den
Oudsten bedraagt 1000 Guldens en vrije woning in de Pastorij, dat van
den jongsten is 1100 Guldens.

De Lutersche Gemeente word bediend door een’ Predikant behorende


onder het Consistorie van Amsteldam, zij is eene der aanzienlijkste dier
Geloofsbelijderen in deeze Republiek. De plaats, ter oefening van
hunnen Godsdienst geschikt, is een klein doch net Gebouw, van binnen
versierd met een fraai Orgel. De oorsprong deezer Gemeente word,
volgends de waarschijnlijkste berichten, gesteld op den 28sten
September 1642. Tobias Brustenbach was de eerste Leeraar maar ook
te gelijk derzelver Stichter. In den Jaare 1647 wierd deeze Gemeente,
die tot dien tijd haare Godsdienstige bijeenkomsten in een klein Huisje
op de Achtergracht [4]gehouden had, in staat gesteld tot den aankoop
van een Huis en erve, ’t welk, in 1654 met noch een ander Huis en erve
vergroot, het tegenwoordig Kerkgebouw uitmaakt; tot den Jaare 1782,
was zij in zodanige omstandigheden geplaatst, dat somtijds het
nabuurig Amsteldam tot het onderhoud harer Leeraar moest
medewerken; wanneer zij door een aanzienlijk Legaat, haar bij uiterste
wille besproken door wijle Vrouwe Voigt, wonende te Muiderberg, in
staat gesteld wierd zich zelve te kunnen onderhouden. Den 30
September 1792, wierd eene Jubelpreêk, bij gelegenheid van de 150
jarige instandblijving der Gemeente, door haaren toenmaligen Leeraar
gedaan.

De Roomsch Catholijken hebben hier ook eene Statie, die


tegenwoordig door eenen waereldlijken Pastoor en Capellaan word
waargenomen. Hun Kerkhuis is van binnen met een naar de bouwkunst
geordend altaar versierd, en het gewelf met Bijbelsche en Kerkelijke
Geschiedenissen fraai beschilderd. Waar aan de vochtigheid en
ouderdom echter veel nadeel hebben toegebragt. Daar en boven is het
Gesticht zelve zeer bouwvallig en veel te bekrompen: ter ondersteuning
van het Gregoriaansche Kerkgezang is er een klein doch zeer
welluidend Orgel in geplaatst. Thans is op requeste, door
Kerkmeesteren dier Gemeente gepresenteerd, ten einde een geschikter
Kerkhuis te erlangen, gunstig appui verleend, waar door aan het
verlangen van het grootste getal der Gemeentenaaren spoedig zal
voldaan worden, hebbende de Kerkbestuurders bereids daar toe een
geschikte plaats aangekocht.

De Joden, wier getal alhier sints weinige Jaaren merkelijk is


toegenomen, hebben hier een Sijnagoge of bedehuis, dat een zeer
klein doch net gebouw is.

Onder de Gestichten die eenige aandacht verdienen bekleed het St.


Bartholomei Gasthuis geene geringe plaats. De tijd van derzelver
stichting is onzeker; dat het echter van geenen jongen tijd is, blijkt uit
den naam van hem aan wien het is toegewijd, en wiens beeldtenis of
naam boven alle de buiteningangen dezes Gestichts is uitgehouwen.
Het is een groot en geen onaanzienlijk Gebouw. Ofschoon voor zo verre
men [5]kan nagaan, alleen geschikt voor een Gasthuis of herberging
voor Vreemdelingen, worden thans ook de gebrekkigen en behoeftigen,
die door de Diaconie ondersteund worden, daarin besteed. De
bestuuring van dit huis is thans opgedragen aan 4 Regenten en 3
Regentessen, die ’s Jaarlijks of op nieuw verkoren of anderen in hunne
plaatsen gesteld worden.

Het Burger-Weeshuis, in vroegere Eeuwen een Klooster voor de


Zusteren van St. Jan Euangelist, is een schoon en ruim Gebouw,
geschikt ter herberginge en opvoeding van Weezen, wier Ouderen
Burgeren dezer Stad waren. Deszelfs bestuur staat thans aan 5
Regenten en 4 Regentessen, die mede Jaarlijks aangesteld worden.

Het Armen-Weeshuis, een Gebouw, waarin sints 1667 de Armen


Weezen, die te vooren in het St. Bartholomei Gasthuis gehuisvest
waren, wierden opgevoed, en werwaards zij op besluit van
Burgemeesteren en Vroedschappen in 1790 wederom wierden
overgebragt, dient voor het tegenwoordige ter inkwartieringe der alhier
in Guarnisoen liggende Militie.

De orde vereischt dat hier ter plaatse ook melding gemaakt worde van
de Stichting van wijlen den Heere Cornelis van Drosthagen, bij
beslotene laatste wille, 1714 gemaakt, en 1718 door zijn dood
bevestigd: volgends welke hij zijne Nalatenschap, bestaande in Huizen,
Landerijen enz onder het bestuur van drie Executeuren van de
Roomsche Religie gesteld heeft; zo nochthans dat bij het afsterven van
eenen derzelven een’ Gereformeerde door de aanblijvenden, in
deszelfs plaatse, mogt verkozen worden; welk laatste reeds sints een
aantal Jaaren heeft stand gegrepen.—De voordeelen, uit deeze
Goederen voordspruitende, moeten in drieën verdeeld worden, als aan
zijne behoeftige Vrienden van moeders zijde; aan het Arme Weeshuis,
en aan Armen der Roomsche Gezindheid. Ter gedachtenisse van
deezen Heer is in een gevel van een der vernieuwde Gebouwen een
steen geplaatst, waarop men het volgende versjen leest:

De voorzorg van Drosthagen


Voor Armen, Weez’ en Magen,
Zij steeds bij ’t Nageslacht
Met dankbaarheid herdacht!——

[6]

WAERELDLIJKE GEBOUWEN.

Onder dezelve bekleed het Stadhuis de eerste plaats. Het is een


buitengemeen schoon en kostbaar Gebouw, in den jaare 1772 geheel
nieuw uit den grond opgehaald, pronkende met eenen arduin en
hardsteenen Voorgevel, naar de Jonische en Dorische orden. Zo
schoon dit Gebouw zich uitwendig opdoet, zo fraai is ook deszelfs
binnenste. Bij het ingaan valt terstond de prachtige Vierschaar in ’t oog,
welker beschouwing den Vreemdeling moet uitlokken om het zelve van
binnen te bezichtigen. De Burgerzaal, Burgemeesters, Schepens en
Vroedschapskamer zijn keurig geordend, naar den smaak gestoffeerd
en versierd met prachtige en fraaje schilderstukken, door den Weesper
Burgemeester Gijsbert Jansz. Sibille. Hoewel men den naam van
deezen Kunstliefhebber in de Schilderboeken te vergeefs zoeken zou,
en buiten deeze Stad weinig bekend schijnt te zijn, zo zijn echter de
werken van zijne hand de opmerking der kenneren dubbel waardig.—
Het Gebouw staat op de Grobbe bij de St. Joris brug, die in
bovengemeld jaar met het daar voor liggend plein gelijk gemaakt is. Ter
plaatse waar het tegenwoordig Stadhuis staat, was in het begin der
voorige Eeuw de Schuttershof of de St. Joris Doelen; waar van in het
oude Stadhuis noch eenige overblijfsels te vinden waren.

De Waag, een oud gebouw, voorheen een rondeel der Vestingen, reeds
in den Jaare 1407 geschikt tot het Stadhuis, waar toe het tot 1634
gebruikt is, staat aan de Vecht. Behalve dat dezelve tot het wegen der
Koopmanschappen enz. gebezigd word, strekt zij ook ter
Vergaderplaats van sommige Gilden: terwijl op een harer vertrekken
thans ook de Hoofdwacht der Militairen gehouden word. Derzelver
Voorgevel is niet onaanzienlijk, en pronkt met het Wapen der Stad.

De Stads School, mede geen onaanzienlijk Gebouw, heeft [7]men, niet


zonder grond, te houden voor een gedeelte van het Klooster, het Jonge
Convent genaamd: in deeze kunnen ook de Kinderen van
minvermogende voor niet onderwezen worden, waar toe aan den Stads
Schoolmeester, een Jaarlijks tractement gegeven word.

De Stads Fransche Kostschool voor Jonge Heeren, is een ruim en


luchtig Gebouw, staande op de nieuwe Gracht aan het Zuideinde der
Stad; deeze School is in eenen zeer bloeienden staat.

Voords is alhier noch eene Fransche Kostschool voor Jonge


Juffrouwen, wier aantal geduurig toeneemt.

De Vleeschhal en Bank van Leening zijn geene Stadsgebouwen,


wordende de eerste gehuurd; en de laastgenoemde behoort aan eenen
Jood, die daar voor eene jaarlijksche recognitie aan de Kerk betaalt.

De Godsdienstige en Waereldlijke Gestichten deezer Stad beschouwd


hebbende, gaan wij over tot derzelver

REGEERING.

Alhoewel de kundige Schrijver der Grondwettige Herstelling van


Nederlands Staatswezen verzekert, dat de vastgestelde
Regeeringsform van Wezop of Weesp tot 1445 in handen van het Volk
berustte, schijnen de handvesten der Stad ons het tegendeel
aanteduiden, vermits in een geschreven handvest, die in de gedrukte
niet gevonden wordt, en in 1387, aan die ghemeenen Steden en
Dorpen van Amsterlandt ende van Goijlandt door Herthog Albrecht
van Beieren is gegeven, het 1e. Art. van den volgenden inhoud is. Dat
wij off dien wij dat bevelen, off onse Baliuw, die nu is off naemaels
wesen zal, altoes Schepenen kiesen zal binnen Steden ende opten
Dorpen, alsoe veel als costumelijk is, op onser Vrouwendach te
Lichtmisse van den redelijcxsten en vroetsten knaepen, enz.—1407 gaf
Jan van Beieren, Elect van Luijdik, als Heer van Muijden, van Wesop,
van Naerden ende van Goijlandt, ook eenen openen brieve, in welken
hij om oerbaer ende nutschap wille zijns lands voorss. zijne
bovengenoemde ondersaten overdragen heeft eenige [8]puncten, onder
welke het 10. Art. van ons handschrift dus luidt. „Item, soe willen wij dat
binnen onsen Stede van Weesop van deser tijt voort wesen sullen
seven Scepenen die onse Dienaars daer sullen setten: welke handvest
door Filips van Bourgondien, als Ruwaert ende oir der Landen van
Hollandt in 1425 gheconfirmeert ende ghevesticht is. Hoe het met de
Regeering, voor Albrecht van Beieren, gesteld is geweest, daar van
zijn, zo ver mij bewust is, geene bewijzen voorhanden. Het zij ons
genoeg betoogd te hebben dat de Graven, ten minsten, de Schepenen
hebben aangesteld, en dat zulks geenzins door het Volk of deszelfs
vertegenwoordigers geschied is.—Filips van Bourgondien, gaf in den
Jaare 1445 aan de Stad Weesop de handvest, waar bij hij haar
ghegont ende gheconsenteert heeft, dat voortaen één ende dertich die
rijcste poorteren, die meeste leggende erven en staende ghetimmert
hebben, en de hoegste daer in ’t schodt staen, alle jaer op onser
Vrouwendach Purificatio bij de meeste stemmen kiesen sullen vierthien
goede notabile mannen, uijt den voorss. XXXI of uijt andere die
poorteren van Weesop, uijt welke XIIII persoenen alsoe bij den één en
de dertich ghecoeren wesende bij der meeste stemmen onsen raede
van Hollandt, onse Baliuw van Goijlandt in der tijt wesende off die wij
des machtigen sullen, op onser Vrouwen-dach purificatio kiesen ende
eden sullen seven Scepenen, die dat toecomende Jaer Scepenen
wesen sullen; welke Scepenen voort kiesen sullen ’t eerste jaer drie
Burghemeesteren van onse Stede voorss. Als dat van outs ghewoonlijk
is, ende voert alle jaer twee nieuwen Burghemeesters ende eenen
ouden daar in te laeten blijven.” De verkiezinge der Regenten geschied
ten huidigen dage noch naar den inhoud van dit Privilegie, alleen met

You might also like