illuninocte commited on
Commit
d4166dc
1 Parent(s): a259e17

chore: improve documentation

Browse files
Files changed (1) hide show
  1. README.md +48 -0
README.md CHANGED
@@ -1,6 +1,53 @@
1
  ---
2
  library_name: peft
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4
  ## Training procedure
5
 
6
 
@@ -14,6 +61,7 @@ The following `bitsandbytes` quantization config was used during training:
14
  - bnb_4bit_quant_type: nf4
15
  - bnb_4bit_use_double_quant: False
16
  - bnb_4bit_compute_dtype: float16
 
17
  ### Framework versions
18
 
19
 
 
1
  ---
2
  library_name: peft
3
  ---
4
+ # LLMA finetuned for UFAM legislation Q/A
5
+ Este repositório contém parte de um modelo LLMA especializado para tarefa de responder perguntas relacionadas a legislação da UFAM. O código de treino e um sistema de RAG simples poder ser [encontrado neste notebook](https://colab.research.google.com/drive/1t9WJHiQrYiCt_XXdLz78DBFfIUWFhx1Z?usp=sharing).
6
+
7
+ ## Finetune do Modelo
8
+ O modelo especializado teve como base o Llama-2-7b-chat-hf com os seguintes parâmetros para o LoRA e a quantização do modelo:
9
+
10
+ ```python
11
+ LoraConfig(
12
+ lora_alpha=lora_alpha,
13
+ lora_dropout=lora_dropout,
14
+ r=lora_r,
15
+ bias="none",
16
+ task_type="CAUSAL_LM",
17
+ )
18
+
19
+
20
+ BitsAndBytesConfig(
21
+ load_in_4bit=use_4bit,
22
+ bnb_4bit_quant_type=bnb_4bit_quant_type,
23
+ bnb_4bit_compute_dtype=compute_dtype,
24
+ bnb_4bit_use_double_quant=use_nested_quant,
25
+ )
26
+ ```
27
+
28
+ ## Avaliação do Modelo
29
+ O modelo foi treinado utilizando [este dataset](https://huggingface.co/datasets/illuninocte/llama-ufam-legislacao) no decorrer de três épocas com todos os dados a fim de melhorar sua performance. Ele começou com uma LOSS de `3.4873` e baixou até `1.0381` durante o processo de treino.
30
+
31
+ ### Exemplos de Perguntas e Respostas
32
+ 1. **Quando a terceira solicitação de matrícula ocorre?**
33
+
34
+ ```
35
+ A terceira solicitação de matrícula ocorre em 15 de janeiro do ano letivo correspondente
36
+ ```
37
+
38
+ 2. **Qual é a missão da pró-reitoria de ensino de graduação (PROEG)?**
39
+
40
+ ```
41
+ A missão da PROEG é promover a qualidade do ensino de graduação e a formação de profissionais do magistério.
42
+ ```
43
+
44
+ 3. **Qual documentação deve ser enviada à coordenação de curso após a prática de campo?**
45
+
46
+ ```
47
+ Deve ser enviada uma notificação de conclusão do campo de práticas, com o nome do aluno, data e local do campo, e o nome do coordenador de curso.
48
+ ```
49
+
50
+
51
  ## Training procedure
52
 
53
 
 
61
  - bnb_4bit_quant_type: nf4
62
  - bnb_4bit_use_double_quant: False
63
  - bnb_4bit_compute_dtype: float16
64
+
65
  ### Framework versions
66
 
67