Spaces:

protectai
/

llm-guard-playground

Running

App Files Files Community

asofter commited on Mar 14, 2024

Commit

10cef3f

1 Parent(s): 61173ea

* upgrade version

Browse files

* add Gibberish scanner

Files changed (3) hide show

output.py +26 -4
prompt.py +38 -1
requirements.txt +4 -4

output.py CHANGED Viewed

@@ -9,8 +9,8 @@ from llm_guard.input_scanners.code import SUPPORTED_LANGUAGES as SUPPORTED_CODE_
 from llm_guard.output_scanners import get_scanner_by_name
 from llm_guard.output_scanners.bias import MatchType as BiasMatchType
 from llm_guard.output_scanners.deanonymize import MatchingStrategy as DeanonymizeMatchingStrategy
 from llm_guard.output_scanners.language import MatchType as LanguageMatchType
-from llm_guard.output_scanners.relevance import all_models as relevance_models
 from llm_guard.output_scanners.toxicity import MatchType as ToxicityMatchType
 from llm_guard.vault import Vault
 from streamlit_tags import st_tags
@@ -33,6 +33,7 @@ def init_settings() -> (List, Dict):
         "NoRefusal",
         "ReadingTime",
         "FactualConsistency",
         "Regex",
         "Relevance",
         "Sensitive",
@@ -389,9 +390,7 @@ def init_settings() -> (List, Dict):
                 key="rele_threshold",
             )
-            st_rele_model = st.selectbox("Embeddings model", relevance_models, index=1)
-        settings["Relevance"] = {"threshold": st_rele_threshold, "model": st_rele_model}
     if "Sensitive" in st_enabled_scanners:
         st_sens_expander = st.sidebar.expander(
@@ -484,6 +483,28 @@ def init_settings() -> (List, Dict):
         if st_url_expander:
             settings["URLReachability"] = {}
     return st_enabled_scanners, settings
@@ -497,6 +518,7 @@ def get_scanner(scanner_name: str, vault: Vault, settings: Dict):
         "BanTopics",
         "Bias",
         "Code",
         "Language",
         "LanguageSame",
         "MaliciousURLs",

 from llm_guard.output_scanners import get_scanner_by_name
 from llm_guard.output_scanners.bias import MatchType as BiasMatchType
 from llm_guard.output_scanners.deanonymize import MatchingStrategy as DeanonymizeMatchingStrategy
+from llm_guard.output_scanners.gibberish import MatchType as GibberishMatchType
 from llm_guard.output_scanners.language import MatchType as LanguageMatchType
 from llm_guard.output_scanners.toxicity import MatchType as ToxicityMatchType
 from llm_guard.vault import Vault
 from streamlit_tags import st_tags
         "NoRefusal",
         "ReadingTime",
         "FactualConsistency",
+        "Gibberish",
         "Regex",
         "Relevance",
         "Sensitive",
                 key="rele_threshold",
             )
+        settings["Relevance"] = {"threshold": st_rele_threshold}
     if "Sensitive" in st_enabled_scanners:
         st_sens_expander = st.sidebar.expander(
         if st_url_expander:
             settings["URLReachability"] = {}
+    if "Gibberish" in st_enabled_scanners:
+        st_gib_expander = st.sidebar.expander(
+            "Gibberish",
+            expanded=False,
+        )
+        with st_gib_expander:
+            st_gib_threshold = st.slider(
+                label="Threshold",
+                value=0.7,
+                min_value=0.0,
+                max_value=1.0,
+                step=0.1,
+                key="gib_threshold",
+            )
+            st_gib_match_type = st.selectbox(
+                "Match type", [e.value for e in GibberishMatchType], index=1, key="gib_match_type"
+            )
+        settings["Gibberish"] = {"match_type": st_gib_match_type, "threshold": st_gib_threshold}
     return st_enabled_scanners, settings
         "BanTopics",
         "Bias",
         "Code",
+        "Gibberish",
         "Language",
         "LanguageSame",
         "MaliciousURLs",

prompt.py CHANGED Viewed

@@ -7,6 +7,7 @@ import streamlit as st
 from llm_guard.input_scanners import get_scanner_by_name
 from llm_guard.input_scanners.anonymize import default_entity_types
 from llm_guard.input_scanners.code import SUPPORTED_LANGUAGES as SUPPORTED_CODE_LANGUAGES
 from llm_guard.input_scanners.language import MatchType as LanguageMatchType
 from llm_guard.input_scanners.prompt_injection import MatchType as PromptInjectionMatchType
 from llm_guard.input_scanners.toxicity import MatchType as ToxicityMatchType
@@ -23,6 +24,7 @@ def init_settings() -> (List, Dict):
         "BanSubstrings",
         "BanTopics",
         "Code",
         "Language",
         "PromptInjection",
         "Regex",
@@ -215,6 +217,34 @@ def init_settings() -> (List, Dict):
             "is_blocked": st_cd_is_blocked,
         }
     if "Language" in st_enabled_scanners:
         st_lan_expander = st.sidebar.expander(
             "Language",
@@ -410,7 +440,14 @@ def get_scanner(scanner_name: str, vault: Vault, settings: Dict):
     if scanner_name == "Anonymize":
         settings["vault"] = vault
-    if scanner_name in ["Anonymize", "BanTopics", "Code", "PromptInjection", "Toxicity"]:
         settings["use_onnx"] = True
     return get_scanner_by_name(scanner_name, settings)

 from llm_guard.input_scanners import get_scanner_by_name
 from llm_guard.input_scanners.anonymize import default_entity_types
 from llm_guard.input_scanners.code import SUPPORTED_LANGUAGES as SUPPORTED_CODE_LANGUAGES
+from llm_guard.input_scanners.gibberish import MatchType as GibberishMatchType
 from llm_guard.input_scanners.language import MatchType as LanguageMatchType
 from llm_guard.input_scanners.prompt_injection import MatchType as PromptInjectionMatchType
 from llm_guard.input_scanners.toxicity import MatchType as ToxicityMatchType
         "BanSubstrings",
         "BanTopics",
         "Code",
+        "Gibberish",
         "Language",
         "PromptInjection",
         "Regex",
             "is_blocked": st_cd_is_blocked,
         }
+    if "Gibberish" in st_enabled_scanners:
+        st_gib_expander = st.sidebar.expander(
+            "Gibberish",
+            expanded=False,
+        )
+        with st_gib_expander:
+            st_gib_threshold = st.slider(
+                label="Threshold",
+                value=0.7,
+                min_value=0.0,
+                max_value=1.0,
+                step=0.1,
+                key="gibberish_threshold",
+            )
+            st_gib_match_type = st.selectbox(
+                "Match type",
+                [e.value for e in GibberishMatchType],
+                index=1,
+                key="gibberish_match_type",
+            )
+        settings["Gibberish"] = {
+            "threshold": st_gib_threshold,
+            "match_type": st_gib_match_type,
+        }
     if "Language" in st_enabled_scanners:
         st_lan_expander = st.sidebar.expander(
             "Language",
     if scanner_name == "Anonymize":
         settings["vault"] = vault
+    if scanner_name in [
+        "Anonymize",
+        "BanTopics",
+        "Code",
+        "Gibberish",
+        "PromptInjection",
+        "Toxicity",
+    ]:
         settings["use_onnx"] = True
     return get_scanner_by_name(scanner_name, settings)

requirements.txt CHANGED Viewed

@@ -1,5 +1,5 @@
-llm-guard==0.3.9
-llm-guard[onnxruntime]==0.3.9
-pandas==2.2.0
-streamlit==1.31.0
 streamlit-tags==1.2.8

+llm-guard==0.3.10
+llm-guard[onnxruntime]==0.3.10
+pandas==2.2.1
+streamlit==1.32.1
 streamlit-tags==1.2.8