--- language: - pt tags: - generated_from_trainer datasets: - carolina-c4ai/corpus-carolina metrics: - precision - recall - f1 - accuracy model-index: - name: checkpoints results: - task: name: Token Classification type: token-classification dataset: name: carolina-c4ai/corpus-carolina type: carolina-c4ai/corpus-carolina metrics: - name: F1 type: f1 value: 0.9470445768148197 - name: Precision type: precision value: 0.9544794827813696 - name: Recall type: recall value: 0.9191397849462366 - name: Accuracy type: accuracy value: 0.9470445768148197 - name: Loss type: loss value: 0.939724603793193 widget: - text: >- Falsificação de documento público, uso de documento falso. Anotação de Responsabilidade Técnica Nº 1055330634101 de 12 de janeiro de 2013 relativa à Lei Federal Nº 531. Trata-se de representação referente a possível falsificação documentação técnica registrada pelo CREA-SP, feita pelo senhor Francis Pantele da Cozzi, CPF: 412.612.341-32, telefone (31) 951358433, email fran@bol.com, atinente à sua contratação pela senhora Marinalva Bete Raz, CPF: 049.567.041-22, telefone (61) 9412 3333, mulher branca, opinião política conservadora, religião evangélica. Marinalva Bete Raz reclama por indenização por danos morais no dia 14.05.2013 no valor de R$ 82.662,00 (Oitenta e dois mil, seiscentos e sessenta e dois reais) relacionado ao endereço IP 192.168.01 e ao endereço constante no CEP 59123-222, Rua dos Pioneiros, nº 450, Jardim Esmeralda, Campo Grande, MS. Ela afirma que precisa deste dinheiro o mais rápido possível, já que sua saúde está comprometida, pois sofre de asma. A parte Francis Pantele da Cozzi afirma que apenas possui 5.534,00 reais como patrimônio e precisa do dinheiro para sustentar seu filho menor de idade chamado Josué Vittas. base_model: - pierreguillou/ner-bert-large-cased-pt-lenerbr --- ## NER model in the legal domain in Portuguese according to LGPD (Brazilian Law for Data Protection) **legal-bert-lgpd** is a NER model (token classification) in the legal domain in Portuguese that classifies the tokens into the following classes: | Labels | | -------- | | NOME | | DATA | | ENDERECO | | CEP | | CPF | | TELEFONE | | EMAIL | | DINHEIRO | ```python Num examples = 3,971 Num Epochs = 5 Instantaneous batch size per device = 16 Total train batch size (w. parallel, distributed & accumulation) = 16 Gradient Accumulation steps = 1 Total optimization steps = 1,245 Number of trainable parameters = 333,364,241 ```