Unstructured-IO
diff --git a/‎README.md
+15-22 b/‎README.md
+15-22
diff --git a/‎sample-docs/layout-parser-paper-fast.pdf
-168 KB b/‎sample-docs/layout-parser-paper-fast.pdf
-168 KB
diff --git a/‎setup.py
+5-3 b/‎setup.py
+5-3
diff --git a/‎src/unstructured_client/general.py
+31-59 b/‎src/unstructured_client/general.py
+31-59
diff --git a/‎src/unstructured_client/models/errors/__init__.py
+1-1 b/‎src/unstructured_client/models/errors/__init__.py
+1-1
diff --git a/‎src/unstructured_client/models/errors/httpvalidationerror.py
+3-9 b/‎src/unstructured_client/models/errors/httpvalidationerror.py
+3-9
diff --git a/‎src/unstructured_client/models/errors/sdkerror.py
+4-11 b/‎src/unstructured_client/models/errors/sdkerror.py
+4-11
diff --git a/‎src/unstructured_client/models/errors/validationerror.py
+5-9 b/‎src/unstructured_client/models/errors/validationerror.py
+5-9
diff --git a/‎src/unstructured_client/models/operations/partition.py
+2 b/‎src/unstructured_client/models/operations/partition.py
+2
diff --git a/‎src/unstructured_client/models/shared/__init__.py
+1-1 b/‎src/unstructured_client/models/shared/__init__.py
+1-1
diff --git a/‎src/unstructured_client/models/shared/partition_parameters.py
+23-59 b/‎src/unstructured_client/models/shared/partition_parameters.py
+23-59
@@ -34,37 +34,30 @@ from unstructured_client.models.errors import SDKError
 
 s = UnstructuredClient(api_key_auth="YOUR_API_KEY")
 
-filename = "sample-docs/layout-parser-paper-fast.pdf"
-
-with open(filename, "rb") as f:
-    # Note that this currently only supports a single file
-	files=shared.Files(
-		content=f.read(),
-		file_name=filename,
-	)
+filename = "sample-docs/layout-parser-paper.pdf"
+file = open(filename, "rb")
 
 req = shared.PartitionParameters(
-    files=files,
-    strategy='ocr_only',
-	languages=["eng"],
+    # Note that this currently only supports a single file
+    files=shared.Files(
+        content=file.read(),
+        file_name=filename,
+    ),
+    # Other partition params
+    strategy="fast",
 )
 
 try:
-    resp = s.general.partition(req)
-    print(resp.elements[0])
+    res = s.general.partition(req)
+    print(res.elements[0])
 except SDKError as e:
     print(e)
 
 # {
-# 'type': 'UncategorizedText', 
-# 'element_id': 'fc550084fda1e008e07a0356894f5816', 
-# 'metadata': {
-#   'filename': 'layout-parser-paper-fast.pdf', 
-#   'filetype': 'application/pdf', 
-#   'languages': ['eng'], 
-#   'page_number': 1
-# }, 
-# 'text': '2103.15348v2 [cs.CV] 21 Jun 2021'
+#  'type': 'Title',
+#  'element_id': '015301d4f56aa4b20ec10ac889d2343f',
+#  'metadata': {'filename': 'layout-parser-paper.pdf', 'filetype': 'application/pdf', 'page_number': 1},
+#  'text': 'LayoutParser: A Uniﬁed Toolkit for Deep Learning Based Document Image Analysis'
 # }
 ```
 
 
@@ -32,7 +32,9 @@
         "typing_extensions>=4.7.1",
         "urllib3>=2.0.4",
     ],
-    extras_require={"dev": ["pylint==2.16.2"]},
-    package_dir={"": "src"},
-    python_requires=">=3.8",
+    extras_require={
+        "dev":["pylint==2.16.2"]
+    },
+    package_dir={'': 'src'},
+    python_requires='>=3.8'
 )
@@ -5,93 +5,65 @@
 from unstructured_client import utils
 from unstructured_client.models import errors, operations, shared
 
-
 class General:
     sdk_configuration: SDKConfiguration
 
     def __init__(self, sdk_config: SDKConfiguration) -> None:
         self.sdk_configuration = sdk_config
-
-    def partition(
-        self,
-        request: shared.PartitionParameters,
-        retries: Optional[utils.RetryConfig] = None,
-    ) -> operations.PartitionResponse:
+        
+    
+    
+    def partition(self, request: shared.PartitionParameters, retries: Optional[utils.RetryConfig] = None) -> operations.PartitionResponse:
         r"""Pipeline 1"""
         base_url = utils.template_url(*self.sdk_configuration.get_server_details())
-
-        url = base_url + "/general/v0/general"
+        
+        url = base_url + '/general/v0/general'
         headers = {}
-        req_content_type, data, form = utils.serialize_request_body(
-            request, "request", False, True, "multipart"
-        )
-        if req_content_type not in ("multipart/form-data", "multipart/mixed"):
-            headers["content-type"] = req_content_type
-        headers["Accept"] = "application/json"
-        headers["user-agent"] = self.sdk_configuration.user_agent
-
+        req_content_type, data, form = utils.serialize_request_body(request, "request", False, True, 'multipart')
+        if req_content_type not in ('multipart/form-data', 'multipart/mixed'):
+            headers['content-type'] = req_content_type
+        headers['Accept'] = 'application/json'
+        headers['user-agent'] = self.sdk_configuration.user_agent
+        
         if callable(self.sdk_configuration.security):
-            client = utils.configure_security_client(
-                self.sdk_configuration.client, self.sdk_configuration.security()
-            )
+            client = utils.configure_security_client(self.sdk_configuration.client, self.sdk_configuration.security())
         else:
-            client = utils.configure_security_client(
-                self.sdk_configuration.client, self.sdk_configuration.security
-            )
-
+            client = utils.configure_security_client(self.sdk_configuration.client, self.sdk_configuration.security)
+        
         global_retry_config = self.sdk_configuration.retry_config
         retry_config = retries
         if retry_config is None:
             if global_retry_config:
                 retry_config = global_retry_config
             else:
-                retry_config = utils.RetryConfig(
-                    "backoff", utils.BackoffStrategy(500, 60000, 1.5, 3600000), True
-                )
+                retry_config = utils.RetryConfig('backoff', utils.BackoffStrategy(500, 60000, 1.5, 3600000), True)
 
         def do_request():
-            return client.request("POST", url, data=data, files=form, headers=headers)
-
-        http_res = utils.retry(do_request, utils.Retries(retry_config, ["5xx"]))
-        content_type = http_res.headers.get("Content-Type")
+            return client.request('POST', url, data=data, files=form, headers=headers)
 
-        res = operations.PartitionResponse(
-            status_code=http_res.status_code,
-            content_type=content_type,
-            raw_response=http_res,
-        )
+        http_res = utils.retry(do_request, utils.Retries(retry_config, [
+            '5xx'
+        ]))
+        content_type = http_res.headers.get('Content-Type')
 
+        res = operations.PartitionResponse(status_code=http_res.status_code, content_type=content_type, raw_response=http_res)
+        
         if http_res.status_code == 200:
-            if utils.match_content_type(content_type, "application/json"):
+            if utils.match_content_type(content_type, 'application/json'):
                 out = utils.unmarshal_json(http_res.text, Optional[List[Any]])
                 res.elements = out
             else:
-                raise errors.SDKError(
-                    f"unknown content-type received: {content_type}",
-                    http_res.status_code,
-                    http_res.text,
-                    http_res,
-                )
+                raise errors.SDKError(f'unknown content-type received: {content_type}', http_res.status_code, http_res.text, http_res)
         elif http_res.status_code == 422:
-            if utils.match_content_type(content_type, "application/json"):
+            if utils.match_content_type(content_type, 'application/json'):
                 out = utils.unmarshal_json(http_res.text, errors.HTTPValidationError)
                 out.raw_response = http_res
                 raise out
             else:
-                raise errors.SDKError(
-                    f"unknown content-type received: {content_type}",
-                    http_res.status_code,
-                    http_res.text,
-                    http_res,
-                )
-        elif (
-            http_res.status_code >= 400
-            and http_res.status_code < 500
-            or http_res.status_code >= 500
-            and http_res.status_code < 600
-        ):
-            raise errors.SDKError(
-                "API error occurred", http_res.status_code, http_res.text, http_res
-            )
+                raise errors.SDKError(f'unknown content-type received: {content_type}', http_res.status_code, http_res.text, http_res)
+        elif http_res.status_code >= 400 and http_res.status_code < 500 or http_res.status_code >= 500 and http_res.status_code < 600:
+            raise errors.SDKError('API error occurred', http_res.status_code, http_res.text, http_res)
 
         return res
+
+    
@@ -4,4 +4,4 @@
 from .sdkerror import *
 from .validationerror import *
 
-__all__ = ["HTTPValidationError", "SDKError", "ValidationError"]
+__all__ = ["HTTPValidationError","SDKError","ValidationError"]
@@ -9,17 +9,11 @@
 
 
 @dataclass_json(undefined=Undefined.EXCLUDE)
+
 @dataclasses.dataclass
 class HTTPValidationError(Exception):
-    detail: Optional[List[ValidationError]] = dataclasses.field(
-        default=None,
-        metadata={
-            "dataclasses_json": {
-                "letter_case": utils.get_field_name("detail"),
-                "exclude": lambda f: f is None,
-            }
-        },
-    )
+    detail: Optional[List[ValidationError]] = dataclasses.field(default=None, metadata={'dataclasses_json': { 'letter_case': utils.get_field_name('detail'), 'exclude': lambda f: f is None }})
+    
 
     def __str__(self) -> str:
         return utils.marshal_json(self)
@@ -5,27 +5,20 @@
 
 class SDKError(Exception):
     """Represents an error returned by the API."""
-
     message: str
     status_code: int
     body: str
     raw_response: requests_http.Response
 
-    def __init__(
-        self,
-        message: str,
-        status_code: int,
-        body: str,
-        raw_response: requests_http.Response,
-    ):
+    def __init__(self, message: str, status_code: int, body: str, raw_response: requests_http.Response):
         self.message = message
         self.status_code = status_code
         self.body = body
         self.raw_response = raw_response
 
     def __str__(self):
-        body = ""
+        body = ''
         if len(self.body) > 0:
-            body = f"\n{self.body}"
+            body = f'\n{self.body}'
 
-        return f"{self.message}: Status {self.status_code}{body}"
+        return f'{self.message}: Status {self.status_code}{body}'
@@ -10,12 +10,8 @@
 @dataclass_json(undefined=Undefined.EXCLUDE)
 @dataclasses.dataclass
 class ValidationError:
-    loc: List[Union[str, int]] = dataclasses.field(
-        metadata={"dataclasses_json": {"letter_case": utils.get_field_name("loc")}}
-    )
-    msg: str = dataclasses.field(
-        metadata={"dataclasses_json": {"letter_case": utils.get_field_name("msg")}}
-    )
-    type: str = dataclasses.field(
-        metadata={"dataclasses_json": {"letter_case": utils.get_field_name("type")}}
-    )
+    loc: List[Union[str, int]] = dataclasses.field(metadata={'dataclasses_json': { 'letter_case': utils.get_field_name('loc') }})
+    msg: str = dataclasses.field(metadata={'dataclasses_json': { 'letter_case': utils.get_field_name('msg') }})
+    type: str = dataclasses.field(metadata={'dataclasses_json': { 'letter_case': utils.get_field_name('type') }})
+    
+
@@ -16,3 +16,5 @@ class PartitionResponse:
     r"""Successful Response"""
     raw_response: Optional[requests_http.Response] = dataclasses.field(default=None)
     r"""Raw HTTP response; suitable for custom response parsing"""
+    
+
@@ -3,4 +3,4 @@
 from .partition_parameters import *
 from .security import *
 
-__all__ = ["Files", "PartitionParameters", "Security"]
+__all__ = ["Files","PartitionParameters","Security"]
@@ -7,83 +7,47 @@
 
 @dataclasses.dataclass
 class Files:
-    content: bytes = dataclasses.field(metadata={"multipart_form": {"content": True}})
-    file_name: str = dataclasses.field(
-        metadata={"multipart_form": {"field_name": "files"}}
-    )
+    content: bytes = dataclasses.field(metadata={'multipart_form': { 'content': True }})
+    file_name: str = dataclasses.field(metadata={'multipart_form': { 'field_name': 'files' }})
+    
+
 
 
 @dataclasses.dataclass
 class PartitionParameters:
-    chunking_strategy: Optional[str] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "chunking_strategy"}}
-    )
+    chunking_strategy: Optional[str] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'chunking_strategy' }})
     r"""Use one of the supported strategies to chunk the returned elements. Currently supports: by_title"""
-    combine_under_n_chars: Optional[int] = dataclasses.field(
-        default=None,
-        metadata={"multipart_form": {"field_name": "combine_under_n_chars"}},
-    )
+    combine_under_n_chars: Optional[int] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'combine_under_n_chars' }})
     r"""If chunking strategy is set, combine elements until a section reaches a length of n chars. Default: 500"""
-    coordinates: Optional[bool] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "coordinates"}}
-    )
+    coordinates: Optional[bool] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'coordinates' }})
     r"""If true, return coordinates for each element. Default: false"""
-    encoding: Optional[str] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "encoding"}}
-    )
+    encoding: Optional[str] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'encoding' }})
     r"""The encoding method used to decode the text input. Default: utf-8"""
-    files: Optional[Files] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"file": True}}
-    )
+    files: Optional[Files] = dataclasses.field(default=None, metadata={'multipart_form': { 'file': True }})
     r"""The file to extract"""
-    gz_uncompressed_content_type: Optional[str] = dataclasses.field(
-        default=None,
-        metadata={"multipart_form": {"field_name": "gz_uncompressed_content_type"}},
-    )
+    gz_uncompressed_content_type: Optional[str] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'gz_uncompressed_content_type' }})
     r"""If file is gzipped, use this content type after unzipping"""
-    hi_res_model_name: Optional[str] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "hi_res_model_name"}}
-    )
+    hi_res_model_name: Optional[str] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'hi_res_model_name' }})
     r"""The name of the inference model used when strategy is hi_res"""
-    include_page_breaks: Optional[bool] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "include_page_breaks"}}
-    )
+    include_page_breaks: Optional[bool] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'include_page_breaks' }})
     r"""If True, the output will include page breaks if the filetype supports it. Default: false"""
-    languages: Optional[List[str]] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "languages"}}
-    )
+    languages: Optional[List[str]] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'languages' }})
     r"""The languages present in the document, for use in partitioning and/or OCR"""
-    max_characters: Optional[int] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "max_characters"}}
-    )
+    max_characters: Optional[int] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'max_characters' }})
     r"""If chunking strategy is set, cut off new sections after reaching a length of n chars (hard max). Default: 1500"""
-    multipage_sections: Optional[bool] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "multipage_sections"}}
-    )
+    multipage_sections: Optional[bool] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'multipage_sections' }})
     r"""If chunking strategy is set, determines if sections can span multiple sections. Default: true"""
-    new_after_n_chars: Optional[int] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "new_after_n_chars"}}
-    )
+    new_after_n_chars: Optional[int] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'new_after_n_chars' }})
     r"""If chunking strategy is set, cut off new sections after reaching a length of n chars (soft max). Default: 1500"""
-    output_format: Optional[str] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "output_format"}}
-    )
+    output_format: Optional[str] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'output_format' }})
     r"""The format of the response. Supported formats are application/json and text/csv. Default: application/json."""
-    pdf_infer_table_structure: Optional[bool] = dataclasses.field(
-        default=None,
-        metadata={"multipart_form": {"field_name": "pdf_infer_table_structure"}},
-    )
+    pdf_infer_table_structure: Optional[bool] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'pdf_infer_table_structure' }})
     r"""If True and strategy=hi_res, any Table Elements extracted from a PDF will include an additional metadata field, 'text_as_html', where the value (string) is a just a transformation of the data into an HTML <table>."""
-    skip_infer_table_types: Optional[List[str]] = dataclasses.field(
-        default=None,
-        metadata={"multipart_form": {"field_name": "skip_infer_table_types"}},
-    )
+    skip_infer_table_types: Optional[List[str]] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'skip_infer_table_types' }})
     r"""The document types that you want to skip table extraction with. Default: ['pdf', 'jpg', 'png']"""
-    strategy: Optional[str] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "strategy"}}
-    )
+    strategy: Optional[str] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'strategy' }})
     r"""The strategy to use for partitioning PDF/image. Options are fast, hi_res, auto. Default: auto"""
-    xml_keep_tags: Optional[bool] = dataclasses.field(
-        default=None, metadata={"multipart_form": {"field_name": "xml_keep_tags"}}
-    )
+    xml_keep_tags: Optional[bool] = dataclasses.field(default=None, metadata={'multipart_form': { 'field_name': 'xml_keep_tags' }})
     r"""If True, will retain the XML tags in the output. Otherwise it will simply extract the text from within the tags. Only applies to partition_xml."""
+    
+