Python - Adding some stub files

2025-08-22 16:25:30 +00:00 · 2020-01-06 13:04:30 -05:00
parent 7eebd06409
commit d7b6385566
6 changed files with 145 additions and 0 deletions
--- a/bindings/python/tokenizers/decoders/init.pyi
+++ b/bindings/python/tokenizers/decoders/init.pyi
@ -0,0 +1,28 @@
+from .. import decoders
+
+class Decoder:
+    """Decoder
+    """
+
+    @staticmethod
+    def custom():
+        pass
+
+    def decode(tokens: List[str]) -> str:
+        pass
+
+class ByteLevel:
+    """ByteLevel
+    """
+
+    @staticmethod
+    def new() -> Decoder:
+        pass
+
+class WordPiece:
+    """WordPiece
+    """
+
+    @staticmethod
+    def new() -> Decoder:
+        pass
--- a/bindings/python/tokenizers/models/init.pyi
+++ b/bindings/python/tokenizers/models/init.pyi
@ -0,0 +1,33 @@
+from .. import models
+
+class Model:
+    """Model
+    """
+
+    def save(folder: str, name: str) -> List[str]:
+        """ save
+        Save the current Model in the given folder, using the given name for the various
+        files that will get created.
+        Any file with the same name that already exist in this folder will be overwritten
+        """
+        pass
+
+class BPE:
+    """BPE
+    """
+
+    def from_files(vocab: str, merges: str) -> Model:
+        pass
+
+    def empty() -> Model:
+        pass
+
+class WordPiece:
+    """WordPiece
+    """
+
+    def from_files(vocab: str) -> Model:
+        pass
+
+    def empty() -> Model:
+        pass
--- a/bindings/python/tokenizers/normalizers/init.pyi
+++ b/bindings/python/tokenizers/normalizers/init.pyi
@ -0,0 +1,12 @@
+from .. import normalizers
+
+class Normalizer:
+    """Normalizer
+    """
+
+class BertNormalizer:
+    """BertNormalizer
+    """
+
+    def new() -> Normalizer:
+        pass
--- a/bindings/python/tokenizers/pre_tokenizers/init.pyi
+++ b/bindings/python/tokenizers/pre_tokenizers/init.pyi
@ -0,0 +1,38 @@
+from .. import pre_tokenizers
+
+Offsets = Tuple[int, int]
+
+class PreTokenizer:
+    """PreTokenizer
+    """
+
+    def pre_tokenize(self, sequence: str) -> List[Tuple[str, Offsets]]:
+        pass
+
+class ByteLevel:
+    """ByteLevel
+    """
+
+    @staticmethod
+    def new() -> PreTokenizer:
+        pass
+
+    @staticmethod
+    def alphabet() -> List[str]:
+        pass
+
+class Whitespace:
+    """Whitespace
+    """
+
+    @staticmethod
+    def new() -> PreTokenizer:
+        pass
+
+class BertPreTokenizer:
+    """BertPreTokenizer
+    """
+
+    @staticmethod
+    def new() -> PreTokenizer:
+        pass
--- a/bindings/python/tokenizers/processors/init.pyi
+++ b/bindings/python/tokenizers/processors/init.pyi
@ -0,0 +1,13 @@
+from .. import processors
+
+class PostProcessor:
+    """PostProcessor
+    """
+
+class BertProcessing:
+    """BertProcessing
+    """
+
+    @staticmethod
+    def new(sep: Tuple[str, int], cls: Tuple[str, int]) -> PostProcessor:
+        pass
--- a/bindings/python/tokenizers/trainers/init.pyi
+++ b/bindings/python/tokenizers/trainers/init.pyi
@ -0,0 +1,21 @@
+from .. import trainers
+
+class Trainer:
+    """Trainer
+    """
+
+class BpeTrainer:
+    """BpeTrainer
+    """
+
+    @staticmethod
+    def new() -> Trainer:
+        pass
+
+class WordPieceTrainer:
+    """WordPieceTrainer
+    """
+
+    @staticmethod
+    def new() -> Trainer:
+        pass