> For the complete documentation index, see [llms.txt](https://docs.decube.io/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.decube.io/transformation-tools/apache-spark.md).

# Apache Spark

## Supported Capabilities

{% tabs %}
{% tab title="Supported Capabilities" %}
**General**

* **Metadata** — metadata extraction and display of asset information (tables, columns, schemas). Types collected: Schema, Virtual Table, Virtual Column, Data Job, Data Run, Data Task

**Data Quality Monitors**

* Job Failure
  {% endtab %}

{% tab title="Not Supported" %}
**General**

* Profiling
* Preview
* Data Quality
* Configurable Collection
* External Table
* View Table
* Stored Procedure

**Data Quality Monitors**

* Freshness
* Volume
* Field Health
* Custom SQL
* Schema Drift
  {% endtab %}
  {% endtabs %}

Apache Spark can map lineage relationships to upstream and downstream objects from the following connectors:

* Upstream Connectors: postgresql, adls
* Downstream Connectors: postgresql, adls

## Connection Requirements

Please see the instructions and minimum requirements for configuration in each data source below:

* [Azure Synapse](/transformation-tools/apache-spark/apache-spark-in-azure-synapse.md)