From 42e2185f620ae97da8113c3ac57125c5e2da5dc9 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Florian=20F=C3=B6rster?=
 <florian.foerster@mb.tu-chemnitz.de>
Date: Wed, 15 Jan 2025 18:09:36 +0100
Subject: [PATCH] several changes for local models

---
 notebooks/lang_main.xml                 | 128 ------------------------
 notebooks/styles_template.xml           | 123 -----------------------
 notebooks/test.graphml                  |  37 -------
 notebooks/tk_graph_built.graphml        |  73 --------------
 notebooks/tk_graph_built.pkl            | Bin 1766 -> 0 bytes
 pyproject.toml                          |   4 +-
 src/lang_main/analysis/preprocessing.py |   4 +-
 src/lang_main/constants.py              |   7 +-
 src/lang_main/model_loader.py           |  54 +++++++++-
 src/lang_main/types.py                  |  14 +++
 test.ps1                                |   1 -
 11 files changed, 75 insertions(+), 370 deletions(-)
 delete mode 100644 notebooks/lang_main.xml
 delete mode 100644 notebooks/styles_template.xml
 delete mode 100644 notebooks/test.graphml
 delete mode 100644 notebooks/tk_graph_built.graphml
 delete mode 100644 notebooks/tk_graph_built.pkl
 delete mode 100644 test.ps1
diff --git a/notebooks/lang_main.xml b/notebooks/lang_main.xml
deleted file mode 100644
index 93adff8..0000000
--- a/notebooks/lang_main.xml
+++ /dev/null
@@ -1,128 +0,0 @@
-<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
-<vizmap id="VizMap-2024_07_12-08_08" documentVersion="3.1">
-    <visualStyle name="lang_main">
-        <network>
-            <visualProperty default="0.0" name="NETWORK_CENTER_X_LOCATION"/>
-            <visualProperty default="0.0" name="NETWORK_CENTER_Y_LOCATION"/>
-            <visualProperty default="0.0" name="NETWORK_CENTER_Z_LOCATION"/>
-            <visualProperty default="false" name="NETWORK_ANNOTATION_SELECTION"/>
-            <visualProperty default="1.0" name="NETWORK_SCALE_FACTOR"/>
-            <visualProperty default="false" name="NETWORK_NODE_LABEL_SELECTION"/>
-            <visualProperty default="400.0" name="NETWORK_HEIGHT"/>
-            <visualProperty default="true" name="NETWORK_NODE_SELECTION"/>
-            <visualProperty default="550.0" name="NETWORK_WIDTH"/>
-            <visualProperty default="0.0" name="NETWORK_DEPTH"/>
-            <visualProperty default="false" name="NETWORK_FORCE_HIGH_DETAIL"/>
-            <visualProperty default="" name="NETWORK_TITLE"/>
-            <visualProperty default="true" name="NETWORK_EDGE_SELECTION"/>
-            <visualProperty default="#F7FFFF" name="NETWORK_BACKGROUND_PAINT"/>
-        </network>
-        <node>
-            <dependency value="true" name="nodeCustomGraphicsSizeSync"/>
-            <dependency value="true" name="nodeSizeLocked"/>
-            <visualProperty default="ROUND_RECTANGLE" name="NODE_LABEL_BACKGROUND_SHAPE"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_9"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_7"/>
-            <visualProperty default="true" name="NODE_NESTED_NETWORK_IMAGE_VISIBLE"/>
-            <visualProperty default="0.0" name="NODE_LABEL_ROTATION"/>
-            <visualProperty default="175" name="NODE_LABEL_BACKGROUND_TRANSPARENCY"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_8"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_2"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_6"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_7"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_1"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_4"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_9"/>
-            <visualProperty default="ROUND_RECTANGLE" name="COMPOUND_NODE_SHAPE"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_5"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_9"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_5"/>
-            <visualProperty default="10.0" name="COMPOUND_NODE_PADDING"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_3"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_6"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_8"/>
-            <visualProperty default="SE,NW,c,-2.00,3.00" name="NODE_LABEL_POSITION"/>
-            <visualProperty default="ELLIPSE" name="NODE_SHAPE"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_3"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_4"/>
-            <visualProperty default="SansSerif.plain,plain,12" name="NODE_LABEL_FONT_FACE"/>
-            <visualProperty default="#D1F5BE" name="NODE_BORDER_PAINT"/>
-            <visualProperty default="40.0" name="NODE_HEIGHT"/>
-            <visualProperty default="255" name="NODE_LABEL_TRANSPARENCY"/>
-            <visualProperty default="#E1E1E1" name="NODE_LABEL_BACKGROUND_COLOR"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_6"/>
-            <visualProperty default="false" name="NODE_SELECTED"/>
-            <visualProperty default="0.0" name="NODE_DEPTH"/>
-            <visualProperty default="SOLID" name="NODE_BORDER_STROKE"/>
-            <visualProperty default="" name="NODE_TOOLTIP"/>
-            <visualProperty default="7.0" name="NODE_BORDER_WIDTH"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_2"/>
-            <visualProperty default="#A63C06" name="NODE_LABEL_COLOR"/>
-            <visualProperty default="0.0" name="NODE_X_LOCATION"/>
-            <visualProperty default="18.0" name="NODE_SIZE"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_8"/>
-            <visualProperty default="0.0" name="NODE_Z_LOCATION"/>
-            <visualProperty default="#FE9929" name="NODE_FILL_COLOR"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_1"/>
-            <visualProperty default="255" name="NODE_BORDER_TRANSPARENCY"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_1"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_2"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_3"/>
-            <visualProperty default="60.0" name="NODE_WIDTH"/>
-            <visualProperty default="" name="NODE_LABEL">
-                <passthroughMapping attributeName="name" attributeType="string"/>
-            </visualProperty>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_5"/>
-            <visualProperty default="500.0" name="NODE_LABEL_WIDTH"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_4"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_7"/>
-            <visualProperty default="#FFFF00" name="NODE_SELECTED_PAINT"/>
-            <visualProperty default="0.0" name="NODE_Y_LOCATION"/>
-            <visualProperty default="true" name="NODE_VISIBLE"/>
-            <visualProperty default="255" name="NODE_TRANSPARENCY"/>
-            <visualProperty default="14" name="NODE_LABEL_FONT_SIZE"/>
-        </node>
-        <edge>
-            <dependency value="true" name="arrowColorMatchesEdge"/>
-            <visualProperty default="false" name="EDGE_SELECTED"/>
-            <visualProperty default="255" name="EDGE_TRANSPARENCY"/>
-            <visualProperty default="10" name="EDGE_LABEL_FONT_SIZE"/>
-            <visualProperty default="#577399" name="EDGE_UNSELECTED_PAINT"/>
-            <visualProperty default="" name="EDGE_LABEL"/>
-            <visualProperty default="#FFFFFF" name="EDGE_STROKE_UNSELECTED_PAINT"/>
-            <visualProperty default="200.0" name="EDGE_LABEL_WIDTH"/>
-            <visualProperty default="#000000" name="EDGE_LABEL_COLOR"/>
-            <visualProperty default="SansSerif.plain,plain,10" name="EDGE_LABEL_FONT_FACE"/>
-            <visualProperty default="0.728545744495502,-0.684997151948455,0.6456513365424503" name="EDGE_BEND"/>
-            <visualProperty default="#B6B6B6" name="EDGE_LABEL_BACKGROUND_COLOR"/>
-            <visualProperty default="AUTO_BEND" name="EDGE_STACKING"/>
-            <visualProperty default="#000000" name="EDGE_TARGET_ARROW_UNSELECTED_PAINT"/>
-            <visualProperty default="0.5" name="EDGE_STACKING_DENSITY"/>
-            <visualProperty default="NONE" name="EDGE_TARGET_ARROW_SHAPE"/>
-            <visualProperty default="true" name="EDGE_VISIBLE"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="EDGE_LABEL_POSITION"/>
-            <visualProperty default="0.0" name="EDGE_LABEL_ROTATION"/>
-            <visualProperty default="" name="EDGE_TOOLTIP"/>
-            <visualProperty default="0.0" name="EDGE_Z_ORDER"/>
-            <visualProperty default="#FFFF00" name="EDGE_TARGET_ARROW_SELECTED_PAINT"/>
-            <visualProperty default="#FF0000" name="EDGE_STROKE_SELECTED_PAINT"/>
-            <visualProperty default="NONE" name="EDGE_SOURCE_ARROW_SHAPE"/>
-            <visualProperty default="#FFFF00" name="EDGE_SOURCE_ARROW_SELECTED_PAINT"/>
-            <visualProperty default="false" name="EDGE_LABEL_AUTOROTATE"/>
-            <visualProperty default="true" name="EDGE_CURVED"/>
-            <visualProperty default="#000000" name="EDGE_SOURCE_ARROW_UNSELECTED_PAINT"/>
-            <visualProperty default="255" name="EDGE_LABEL_TRANSPARENCY"/>
-            <visualProperty default="6.0" name="EDGE_TARGET_ARROW_SIZE"/>
-            <visualProperty default="NONE" name="EDGE_LABEL_BACKGROUND_SHAPE"/>
-            <visualProperty default="255" name="EDGE_LABEL_BACKGROUND_TRANSPARENCY"/>
-            <visualProperty default="SOLID" name="EDGE_LINE_TYPE"/>
-            <visualProperty default="6.0" name="EDGE_SOURCE_ARROW_SIZE"/>
-            <visualProperty default="3.0" name="EDGE_WIDTH">
-                <continuousMapping attributeName="weight" attributeType="float">
-                    <continuousMappingPoint attrValue="0.09520000219345093" equalValue="2.0" greaterValue="2.0" lesserValue="1.0"/>
-                    <continuousMappingPoint attrValue="1.0" equalValue="10.0" greaterValue="1.0" lesserValue="10.0"/>
-                </continuousMapping>
-            </visualProperty>
-        </edge>
-    </visualStyle>
-</vizmap>
diff --git a/notebooks/styles_template.xml b/notebooks/styles_template.xml
deleted file mode 100644
index a2090a9..0000000
--- a/notebooks/styles_template.xml
+++ /dev/null
@@ -1,123 +0,0 @@
-<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
-<vizmap id="VizMap-2024_07_10-16_50" documentVersion="3.1">
-    <visualStyle name="template">
-        <network>
-            <visualProperty default="1.0" name="NETWORK_SCALE_FACTOR"/>
-            <visualProperty default="true" name="NETWORK_NODE_SELECTION"/>
-            <visualProperty default="#F7FFFF" name="NETWORK_BACKGROUND_PAINT"/>
-            <visualProperty default="false" name="NETWORK_ANNOTATION_SELECTION"/>
-            <visualProperty default="false" name="NETWORK_NODE_LABEL_SELECTION"/>
-            <visualProperty default="" name="NETWORK_TITLE"/>
-            <visualProperty default="0.0" name="NETWORK_CENTER_X_LOCATION"/>
-            <visualProperty default="true" name="NETWORK_EDGE_SELECTION"/>
-            <visualProperty default="550.0" name="NETWORK_WIDTH"/>
-            <visualProperty default="0.0" name="NETWORK_DEPTH"/>
-            <visualProperty default="400.0" name="NETWORK_HEIGHT"/>
-            <visualProperty default="0.0" name="NETWORK_CENTER_Z_LOCATION"/>
-            <visualProperty default="0.0" name="NETWORK_CENTER_Y_LOCATION"/>
-            <visualProperty default="false" name="NETWORK_FORCE_HIGH_DETAIL"/>
-        </network>
-        <node>
-            <dependency value="true" name="nodeCustomGraphicsSizeSync"/>
-            <dependency value="true" name="nodeSizeLocked"/>
-            <visualProperty default="0.0" name="NODE_LABEL_ROTATION"/>
-            <visualProperty default="14" name="NODE_LABEL_FONT_SIZE"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_3"/>
-            <visualProperty default="10.0" name="COMPOUND_NODE_PADDING"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_6"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_1"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_9"/>
-            <visualProperty default="0.0" name="NODE_Z_LOCATION"/>
-            <visualProperty default="true" name="NODE_VISIBLE"/>
-            <visualProperty default="" name="NODE_TOOLTIP"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_1"/>
-            <visualProperty default="500.0" name="NODE_LABEL_WIDTH"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_5"/>
-            <visualProperty default="#FE9929" name="NODE_FILL_COLOR"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_2"/>
-            <visualProperty default="#A63C06" name="NODE_LABEL_COLOR"/>
-            <visualProperty default="0.0" name="NODE_DEPTH"/>
-            <visualProperty default="7.0" name="NODE_BORDER_WIDTH"/>
-            <visualProperty default="#FFFF00" name="NODE_SELECTED_PAINT"/>
-            <visualProperty default="60.0" name="NODE_WIDTH"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_3"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_7"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_4"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_1"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_8"/>
-            <visualProperty default="SE,NW,c,-2.00,3.00" name="NODE_LABEL_POSITION"/>
-            <visualProperty default="SOLID" name="NODE_BORDER_STROKE"/>
-            <visualProperty default="255" name="NODE_BORDER_TRANSPARENCY"/>
-            <visualProperty default="ROUND_RECTANGLE" name="NODE_LABEL_BACKGROUND_SHAPE"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_8"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_7"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_8"/>
-            <visualProperty default="18.0" name="NODE_SIZE"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_5"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_4"/>
-            <visualProperty default="" name="NODE_LABEL">
-                <passthroughMapping attributeName="name" attributeType="string"/>
-            </visualProperty>
-            <visualProperty default="255" name="NODE_LABEL_TRANSPARENCY"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_6"/>
-            <visualProperty default="ELLIPSE" name="NODE_SHAPE"/>
-            <visualProperty default="#D1F5BE" name="NODE_BORDER_PAINT"/>
-            <visualProperty default="true" name="NODE_NESTED_NETWORK_IMAGE_VISIBLE"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_7"/>
-            <visualProperty default="false" name="NODE_SELECTED"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_9"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_3"/>
-            <visualProperty default="SansSerif.plain,plain,12" name="NODE_LABEL_FONT_FACE"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="NODE_CUSTOMGRAPHICS_POSITION_2"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_4"/>
-            <visualProperty default="#E1E1E1" name="NODE_LABEL_BACKGROUND_COLOR"/>
-            <visualProperty default="0.0" name="NODE_X_LOCATION"/>
-            <visualProperty default="org.cytoscape.cg.model.NullCustomGraphics,0,[ Remove Graphics ]," name="NODE_CUSTOMGRAPHICS_2"/>
-            <visualProperty default="ROUND_RECTANGLE" name="COMPOUND_NODE_SHAPE"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_6"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_5"/>
-            <visualProperty default="0.0" name="NODE_CUSTOMGRAPHICS_SIZE_9"/>
-            <visualProperty default="175" name="NODE_LABEL_BACKGROUND_TRANSPARENCY"/>
-            <visualProperty default="255" name="NODE_TRANSPARENCY"/>
-            <visualProperty default="40.0" name="NODE_HEIGHT"/>
-            <visualProperty default="0.0" name="NODE_Y_LOCATION"/>
-        </node>
-        <edge>
-            <dependency value="true" name="arrowColorMatchesEdge"/>
-            <visualProperty default="NONE" name="EDGE_LABEL_BACKGROUND_SHAPE"/>
-            <visualProperty default="" name="EDGE_TOOLTIP"/>
-            <visualProperty default="AUTO_BEND" name="EDGE_STACKING"/>
-            <visualProperty default="#B6B6B6" name="EDGE_LABEL_BACKGROUND_COLOR"/>
-            <visualProperty default="C,C,c,0.00,0.00" name="EDGE_LABEL_POSITION"/>
-            <visualProperty default="0.728545744495502,-0.684997151948455,0.6456513365424503" name="EDGE_BEND"/>
-            <visualProperty default="10" name="EDGE_LABEL_FONT_SIZE"/>
-            <visualProperty default="NONE" name="EDGE_TARGET_ARROW_SHAPE"/>
-            <visualProperty default="false" name="EDGE_SELECTED"/>
-            <visualProperty default="#000000" name="EDGE_LABEL_COLOR"/>
-            <visualProperty default="#FFFFFF" name="EDGE_STROKE_UNSELECTED_PAINT"/>
-            <visualProperty default="#000000" name="EDGE_TARGET_ARROW_UNSELECTED_PAINT"/>
-            <visualProperty default="255" name="EDGE_LABEL_TRANSPARENCY"/>
-            <visualProperty default="255" name="EDGE_LABEL_BACKGROUND_TRANSPARENCY"/>
-            <visualProperty default="true" name="EDGE_CURVED"/>
-            <visualProperty default="NONE" name="EDGE_SOURCE_ARROW_SHAPE"/>
-            <visualProperty default="0.0" name="EDGE_LABEL_ROTATION"/>
-            <visualProperty default="SansSerif.plain,plain,10" name="EDGE_LABEL_FONT_FACE"/>
-            <visualProperty default="0.5" name="EDGE_STACKING_DENSITY"/>
-            <visualProperty default="#FFFF00" name="EDGE_SOURCE_ARROW_SELECTED_PAINT"/>
-            <visualProperty default="false" name="EDGE_LABEL_AUTOROTATE"/>
-            <visualProperty default="3.0" name="EDGE_WIDTH"/>
-            <visualProperty default="#FF0000" name="EDGE_STROKE_SELECTED_PAINT"/>
-            <visualProperty default="true" name="EDGE_VISIBLE"/>
-            <visualProperty default="#577399" name="EDGE_UNSELECTED_PAINT"/>
-            <visualProperty default="#000000" name="EDGE_SOURCE_ARROW_UNSELECTED_PAINT"/>
-            <visualProperty default="" name="EDGE_LABEL"/>
-            <visualProperty default="255" name="EDGE_TRANSPARENCY"/>
-            <visualProperty default="SOLID" name="EDGE_LINE_TYPE"/>
-            <visualProperty default="6.0" name="EDGE_TARGET_ARROW_SIZE"/>
-            <visualProperty default="200.0" name="EDGE_LABEL_WIDTH"/>
-            <visualProperty default="0.0" name="EDGE_Z_ORDER"/>
-            <visualProperty default="6.0" name="EDGE_SOURCE_ARROW_SIZE"/>
-            <visualProperty default="#FFFF00" name="EDGE_TARGET_ARROW_SELECTED_PAINT"/>
-        </edge>
-    </visualStyle>
-</vizmap>
diff --git a/notebooks/test.graphml b/notebooks/test.graphml
deleted file mode 100644
index 58011f8..0000000
--- a/notebooks/test.graphml
+++ /dev/null
@@ -1,37 +0,0 @@
-<?xml version='1.0' encoding='utf-8'?>
-<graphml xmlns="http://graphml.graphdrawing.org/xmlns" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://graphml.graphdrawing.org/xmlns http://graphml.graphdrawing.org/xmlns/1.0/graphml.xsd">
-  <key id="d1" for="edge" attr.name="weight" attr.type="long" />
-  <key id="d0" for="node" attr.name="degree_weighted" attr.type="long" />
-  <graph edgedefault="directed">
-    <node id="1">
-      <data key="d0">14</data>
-    </node>
-    <node id="2">
-      <data key="d0">10</data>
-    </node>
-    <node id="3">
-      <data key="d0">6</data>
-    </node>
-    <node id="4">
-      <data key="d0">12</data>
-    </node>
-    <edge source="1" target="2">
-      <data key="d1">1</data>
-    </edge>
-    <edge source="1" target="3">
-      <data key="d1">2</data>
-    </edge>
-    <edge source="1" target="4">
-      <data key="d1">5</data>
-    </edge>
-    <edge source="2" target="4">
-      <data key="d1">3</data>
-    </edge>
-    <edge source="2" target="1">
-      <data key="d1">6</data>
-    </edge>
-    <edge source="3" target="4">
-      <data key="d1">4</data>
-    </edge>
-  </graph>
-</graphml>
diff --git a/notebooks/tk_graph_built.graphml b/notebooks/tk_graph_built.graphml
deleted file mode 100644
index 73538e4..0000000
--- a/notebooks/tk_graph_built.graphml
+++ /dev/null
@@ -1,73 +0,0 @@
-<?xml version='1.0' encoding='utf-8'?>
-<graphml xmlns="http://graphml.graphdrawing.org/xmlns" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://graphml.graphdrawing.org/xmlns http://graphml.graphdrawing.org/xmlns/1.0/graphml.xsd">
-  <key id="d1" for="edge" attr.name="weight" attr.type="long" />
-  <key id="d0" for="node" attr.name="degree_weighted" attr.type="long" />
-  <graph edgedefault="undirected">
-    <node id="Kontrolle">
-      <data key="d0">2</data>
-    </node>
-    <node id="Lichtschranke">
-      <data key="d0">1</data>
-    </node>
-    <node id="Überprüfung">
-      <data key="d0">4</data>
-    </node>
-    <node id="Spannrolle">
-      <data key="d0">1</data>
-    </node>
-    <node id="Druckventil">
-      <data key="d0">1</data>
-    </node>
-    <node id="Schmiernippel">
-      <data key="d0">1</data>
-    </node>
-    <node id="Inspektion">
-      <data key="d0">2</data>
-    </node>
-    <node id="Förderbänder">
-      <data key="d0">1</data>
-    </node>
-    <node id="Reinigung">
-      <data key="d0">1</data>
-    </node>
-    <node id="Luftfilter">
-      <data key="d0">1</data>
-    </node>
-    <node id="Schutzabdeckung">
-      <data key="d0">1</data>
-    </node>
-    <node id="Ölstand">
-      <data key="d0">1</data>
-    </node>
-    <node id="Hydraulik">
-      <data key="d0">1</data>
-    </node>
-    <edge source="Kontrolle" target="Lichtschranke">
-      <data key="d1">1</data>
-    </edge>
-    <edge source="Kontrolle" target="Schmiernippel">
-      <data key="d1">1</data>
-    </edge>
-    <edge source="Überprüfung" target="Spannrolle">
-      <data key="d1">1</data>
-    </edge>
-    <edge source="Überprüfung" target="Druckventil">
-      <data key="d1">1</data>
-    </edge>
-    <edge source="Überprüfung" target="Ölstand">
-      <data key="d1">1</data>
-    </edge>
-    <edge source="Überprüfung" target="Hydraulik">
-      <data key="d1">1</data>
-    </edge>
-    <edge source="Inspektion" target="Förderbänder">
-      <data key="d1">1</data>
-    </edge>
-    <edge source="Inspektion" target="Schutzabdeckung">
-      <data key="d1">1</data>
-    </edge>
-    <edge source="Reinigung" target="Luftfilter">
-      <data key="d1">1</data>
-    </edge>
-  </graph>
-</graphml>
diff --git a/notebooks/tk_graph_built.pkl b/notebooks/tk_graph_built.pkl
deleted file mode 100644
index 15b3a5d8a8ffda90b814dee8819c0109b1a5edd1..0000000000000000000000000000000000000000
GIT binary patch
literal 0
HcmV?d00001

literal 1766
zcmb7_TZ<e;6vrKBXLovLcQ%AD#3cj~2Pa_07X@FE5Lh)b*(iw!USd<zUE8NJJ=H^9
zvb(v6qL2hi5z-1?5EQ|0;FE9jG5jKV^qlJMnaPemWTAIYojP^Szv}#|_KU{%|Exdf
zf7}ZxlSw#XLJpW@>5&$CkSI0<ox9ct*_g|BXp}$B&wZKS&-<?7XVG+xP-Zdr&S02H
zqp~!mq1%pmqBsu^xJbb8I3GT*-PTnRfzc5tCdU*8?O_ewvtLGBP1Wr0eJhi~y{293
z#*|4}Wh_G5yUIr6+guuvF4o_OU?RAZVmjpuck5lLr+jQgCW}y1(0P0Imx{R>&Hj-1
zXPzRs&V>}oygaIEUA6mWU!-O!Y#S?CbBB#$9*viSo3kHMZJ3M~8Lu40irG|*E0=X^
zA&YO}unz(K+Qf5OFAgZjbAVHLAbm6}%|M4jPLwV<Ss5=@#!IDPeGtvl`Yx?HUB#T8
z$B=6WzcZyrdyD2NA?C8!OKqblhaOr}g)J+EdNl#OqDhi3)`3?wDLURcIPW*%mQa9m
znlyPyU3gv3MeM+v8nC`wZWFwrNzY2&fhLJ7?$@++C&N&3bC9X=VHmLpco?E^w~=N^
zB9Nws#3-Ba9BM8IW1)CNI6@s)PPkz)Gi>3;ExSP4iN{*!!>wY(<AmcVaN83hLmHJ}
zW8cun4v+iVbS*IdBvVKE-urde_KPaVlbYK!nPKTX<VwT3c4*~XpzBuK8bm46nwNJH
z@7&Y35gK^B8&$8`c+Y&p=w|tbwTElkcg=f<6K@bK-k|RIRfLH55GURsSiC`;c!OZ^
z2GK``g_q0Ho@dYRF^~f|@JgP6<__HTfI$cD755^5Ll4sb!rg_h7I4umDhS_!2Ocx%
z!q=WHOnKkagvRG6|2o3bpl;z~cV^|t6`y9x+!p)*r<>O>>_fDxm(Z=3oIs*Su2E0|
z-@4{oNXT+vA0vx56Jpn-S0EOV$-&x@tJ9m{c2-J9nc`*Pt;_K(7I7IJEhojC%pe+=
z2CJ_Z4{na-Tf6@4U5@R;j}XHJuy7H-$6(z?MesE{LKUYLmthG)YVAkEE%<mCz$e2R
ze2U*q#2G%@ds2gNkElJNxQ<xL<1(SnAHg^9o&Q&Xm71t+t$0{|EquR0Pmh3vw%@a6
p<)~0;9e#qI9l_7=)RNzE$>y&3@7>jLcRk$QC9K(lKmD!-{{nA3qwxR$

diff --git a/pyproject.toml b/pyproject.toml
index 6a7298e..12ad577 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -1,6 +1,6 @@
 [project]
 name = "lang-main"
-version = "0.1.0a9"
+version = "0.1.0a14"
 description = "Several tools to analyse TOM's data with strong focus on language processing"
 authors = [
     {name = "d-opt GmbH, resp. Florian Förster", email = "f.foerster@d-opt.com"},
@@ -154,7 +154,7 @@ directory = "reports/coverage"
 
 
 [tool.bumpversion]
-current_version = "0.1.0a9"
+current_version = "0.1.0a14"
 parse = """(?x)
     (?P<major>0|[1-9]\\d*)\\.
     (?P<minor>0|[1-9]\\d*)\\.
diff --git a/src/lang_main/analysis/preprocessing.py b/src/lang_main/analysis/preprocessing.py
index dcebabd..b5b986b 100644
--- a/src/lang_main/analysis/preprocessing.py
+++ b/src/lang_main/analysis/preprocessing.py
@@ -193,7 +193,9 @@ def analyse_feature(
 
         result_df = pd.concat([result_df, conc_df], ignore_index=True)
 
-    result_df = result_df.sort_values(by='num_occur', ascending=False).copy()
+    result_df = result_df.sort_values(
+        by=['num_occur', 'len'], ascending=[False, False]
+    ).copy()
 
     return (result_df,)
 
diff --git a/src/lang_main/constants.py b/src/lang_main/constants.py
index 7106572..88263b1 100644
--- a/src/lang_main/constants.py
+++ b/src/lang_main/constants.py
@@ -88,14 +88,17 @@ SPACY_MODEL_NAME: Final[str | SpacyModelTypes] = os.environ.get(
     'LANG_MAIN_SPACY_MODEL', SpacyModelTypes.DE_CORE_NEWS_SM
 )
 STFR_MODEL_NAME: Final[str | STFRModelTypes] = os.environ.get(
-    'LANG_MAIN_STFR_MODEL', STFRModelTypes.ALL_MPNET_BASE_V2
+    'LANG_MAIN_STFR_MODEL', STFRModelTypes.E5_BASE_STS_EN_DE
 )
+STFR_CUSTOM_MODELS: Final[dict[tuple[STFRModelTypes, STFRBackends], bool]] = {
+    (STFRModelTypes.E5_BASE_STS_EN_DE, STFRBackends.ONNX): True,
+}
 STFR_DEVICE: Final[STFRDeviceTypes] = STFRDeviceTypes.CPU
 STFR_SIMILARITY: Final[SimilarityFunction] = SimilarityFunction.COSINE
 STFR_BACKEND: Final[str | STFRBackends] = os.environ.get(
     'LANG_MAIN_STFR_BACKEND', STFRBackends.TORCH
 )
-stfr_model_args_default: STFRModelArgs = {}
+stfr_model_args_default: STFRModelArgs = {'torch_dtype': 'float32'}
 stfr_model_args_onnx: STFRModelArgs = {
     'file_name': STFRQuantFilenames.ONNX_Q_UINT8,
     'provider': ONNXExecutionProvider.CPU,
diff --git a/src/lang_main/model_loader.py b/src/lang_main/model_loader.py
index 99e9dc1..7e49250 100644
--- a/src/lang_main/model_loader.py
+++ b/src/lang_main/model_loader.py
@@ -12,8 +12,10 @@ from typing import (
 from sentence_transformers import SentenceTransformer, SimilarityFunction
 
 from lang_main.constants import (
+    MODEL_BASE_FOLDER,
     SPACY_MODEL_NAME,
     STFR_BACKEND,
+    STFR_CUSTOM_MODELS,
     STFR_DEVICE,
     STFR_MODEL_ARGS,
     STFR_MODEL_NAME,
@@ -28,6 +30,7 @@ from lang_main.types import (
     STFRBackends,
     STFRDeviceTypes,
     STFRModelArgs,
+    STFRModelTypes,
 )
 
 
@@ -74,22 +77,67 @@ def load_spacy(
     return pretrained_model
 
 
+def _preprocess_STFR_model_name(
+    model_name: STFRModelTypes,
+    backend: STFRBackends,
+) -> str:
+    """utility function to parse specific model names to their
+    local file paths per backend
+    necessary for models not present on the Huggingface Hub (like
+    own pretrained or optimised models)
+    only if chosen model and backend in combination are defined a local
+    file path is generated
+
+    Parameters
+    ----------
+    model_name : STFRModelTypes
+        model name given by configuration
+    backend: STFRBackends
+        backend given by configuration
+
+    Returns
+    -------
+    str
+        model name or specific file path if applicable
+    """
+    combination = (model_name, backend)
+    model_name_or_path: str
+    if combination in STFR_CUSTOM_MODELS and STFR_CUSTOM_MODELS[combination]:
+        # !! defined that each model is placed in a folder with its model name
+        # !! without any user names
+        folder_name = model_name.split('/')[-1]
+        model_path = MODEL_BASE_FOLDER / folder_name
+        if not model_path.exists():
+            raise FileNotFoundError(
+                f'Target model >{model_name}< not found under {model_path}'
+            )
+        model_name_or_path = str(model_path)
+    else:
+        model_name_or_path = model_name
+
+    return model_name_or_path
+
+
 def load_sentence_transformer(
-    model_name: str,
+    model_name: STFRModelTypes,
     similarity_func: SimilarityFunction = SimilarityFunction.COSINE,
     backend: STFRBackends = STFRBackends.TORCH,
     device: STFRDeviceTypes = STFRDeviceTypes.CPU,
     local_files_only: bool = True,
+    trust_remote_code: bool = False,
     model_save_folder: str | None = None,
     model_kwargs: STFRModelArgs | dict[str, Any] | None = None,
 ) -> SentenceTransformer:
+    model_name_or_path = _preprocess_STFR_model_name(model_name=model_name, backend=backend)
+
     return SentenceTransformer(
-        model_name_or_path=model_name,
+        model_name_or_path=model_name_or_path,
         similarity_fn_name=similarity_func,
         backend=backend,  # type: ignore Literal matches Enum
         device=device,
         cache_folder=model_save_folder,
         local_files_only=local_files_only,
+        trust_remote_code=trust_remote_code,
         model_kwargs=model_kwargs,  # type: ignore
     )
 
@@ -99,7 +147,7 @@ MODEL_LOADER_MAP: Final[ModelLoaderMap] = {
     LanguageModels.SENTENCE_TRANSFORMER: {
         'func': load_sentence_transformer,
         'kwargs': {
-            'model_name': STFR_MODEL_NAME,
+            'model_name_or_path': STFR_MODEL_NAME,
             'similarity_func': STFR_SIMILARITY,
             'backend': STFR_BACKEND,
             'device': STFR_DEVICE,
diff --git a/src/lang_main/types.py b/src/lang_main/types.py
index a521c47..b10a585 100644
--- a/src/lang_main/types.py
+++ b/src/lang_main/types.py
@@ -50,6 +50,12 @@ class STFRModelTypes(enum.StrEnum):
     ALL_DISTILROBERTA_V1 = 'all-distilroberta-v1'
     ALL_MINI_LM_L12_V2 = 'all-MiniLM-L12-v2'
     ALL_MINI_LM_L6_V2 = 'all-MiniLM-L6-v2'
+    GERMAN_SEMANTIC_STS_V2 = 'aari1995/German_Semantic_STS_V2'
+    PARAPHRASE_MULTI_MPNET_BASE_V2 = 'paraphrase-multilingual-mpnet-base-v2'
+    JINAAI_BASE_DE_V2 = (
+        'jinaai/jina-embeddings-v2-base-de'  # only for testing, non-commercial
+    )
+    E5_BASE_STS_EN_DE = 'danielheinz/e5-base-sts-en-de'
 
 
 class SpacyModelTypes(enum.StrEnum):
@@ -63,7 +69,15 @@ class STFRQuantFilenames(enum.StrEnum):
     ONNX_Q_UINT8 = 'onnx/model_quint8_avx2.onnx'
 
 
+TorchDTypes: TypeAlias = Literal[
+    'float16',
+    'bfloat16',
+    'float32',
+]
+
+
 class STFRModelArgs(TypedDict):
+    torch_dtype: NotRequired[TorchDTypes]
     provider: NotRequired[ONNXExecutionProvider]
     file_name: NotRequired[STFRQuantFilenames]
     export: NotRequired[bool]
diff --git a/test.ps1 b/test.ps1
deleted file mode 100644
index 4592715..0000000
--- a/test.ps1
+++ /dev/null
@@ -1 +0,0 @@
-pdm run coverage run -p -m pytest -n 6
\ No newline at end of file