From 5d0db484177e732fed68ad25d15d774a4be1c77d Mon Sep 17 00:00:00 2001 From: Hiroyuki Komatsu Date: Mon, 19 Jun 2023 05:22:27 +0000 Subject: [PATCH] Remove redundant entries. MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit * Examples + 大分県中津市中津市の次に番地がくる場合 → 大分県中津市 + 沖縄県島尻郡渡名喜村渡名喜村一円 → 沖縄県島尻郡渡名喜村 #typingquality PiperOrigin-RevId: 541516707 --- src/dictionary/gen_zip_code_seed.py | 9 ++++++++- 1 file changed, 8 insertions(+), 1 deletion(-) diff --git a/src/dictionary/gen_zip_code_seed.py b/src/dictionary/gen_zip_code_seed.py index a75e391ce..69bdffa08 100755 --- a/src/dictionary/gen_zip_code_seed.py +++ b/src/dictionary/gen_zip_code_seed.py @@ -124,7 +124,14 @@ def ReadJigyosyoEntry(zip_code, level1, level2, level3, name): def ParseTownName(level3): """Parse town name.""" - if level3.find(u'以下に掲載がない場合') != -1: + # Skip some exceptional cases + # 871-0099 中津市の次に番地がくる場合 (大分県中津市) + # 409-0142 小菅村の次に1~663番地がくる場合 (山梨県北都留郡小菅村) + # 409-0211 小菅村の次に664番地以降がくる場合 (山梨県北都留郡小菅村) + # 901-3601 渡名喜村一円 (沖縄県島尻郡渡名喜村) + if (level3.find(u'以下に掲載がない場合') != -1 or + level3.endswith(u'がくる場合') or + level3.endswith(u'村一円')): return [''] assert CanParseAddress(level3), ('failed to be merged %s'