🌐 Search * - index.scala-lang.org

31 results

apache/spark 4.0.1

Apache Spark - A unified analytics engine for large-scale data processing

Scala versions: 2.13

sql jdbc big-data java spark scala python r

41897 3350 333
apache/flink 1.20.2

Apache Flink

Scala versions: 2.12

sql big-data java flink scala python

25266 1209 286
combust/mleap 0.23.3

MLeap: Deploy ML Pipelines to Production

Scala versions: 2.12

scikit-learn tensorflow data-pipelines transformers spark scala python

1522 71
bigdatagenomics/adam 0.23.0

ADAM is a genomics analysis platform with specialized file formats built using Apache Avro, Apache Spark, and Apache Parquet. Apache 2 licensed.

Scala versions: 2.11 2.10

parquet genomics big-data java avro spark scala python r bioinformatics

1036 66
lucacanali/sparkmeasure 0.26

This is the development repository for sparkMeasure, a tool and library designed for efficient analysis and troubleshooting of Apache Spark jobs. It focuses on easing the collection and examination of Spark metrics, making it a practical choice for both developers and data engineers.

Scala versions: 2.13 2.12

apache-spark performance-metrics performance-troubleshooting spark scala python

785 14
apache/sedona 1.8.0

A cluster computing framework for processing large-scale geospatial data

Scala versions: 2.13 2.12

spatial-sql spatial-query python geospatial spatial-analysis java scala cluster-computing

2121 138
scalapy/scalapy 0.5.3

Use the world of Python from the comfort of Scala!

Scala versions: 3.x 2.13 2.12

Scala Native versions: 0.4

python scala scala-native

571 15
aws/sagemaker-spark spark_2.4.0-1.4.2.dev0

A Spark library for Amazon SageMaker.

Scala versions: 2.11

sagemaker aws amazon-sagemaker spark scala python machine-learning

300 25
g-research/spark-extension 1.0.0

A library that provides useful extensions to Apache Spark and PySpark.

Scala versions: 2.12

gr-oss java pyspark spark scala python

229 8
catboost/catboost 1.2.8

A fast, scalable, high performance Gradient Boosting on Decision Trees library, used for ranking, classification, regression and other machine learning tasks for Python, R, Java, C++. Supports computation on CPU and GPU.

Scala versions: 2.13 2.12

gpu cuda gbdt tutorial coreml gbm kaggle catboost python r machine-learning decision-trees gradient-boosting categorical-features data-mining big-data gpu-computing data-science

8577 906 195
locationtech-labs/geopyspark 0.3.0

GeoTrellis for PySpark

Scala versions: 2.11

tile-server geotrellis big-data geospatial spark python

180 10
shadaj/scalapy-tensorflow 0.1.0

Static facades for using TensorFlow in ScalaPy

Scala versions: 2.12

python scala scalapy tensorflow

35 1
vizierdb/vizier-scala 2.1.1

The Vizier kernel-free notebook programming environment

Scala versions: 2.12

sql workflow-engine notebook scala python

33 12
isarn/isarn-sketches-spark 0.6.0-sp3.2

Routines and data structures for using isarn-sketches idiomatically in Apache Spark

Scala versions: 2.12

dataframes sketching-algorithm apache-spark aggregator data-sketches dataframe variable-importance datasets t-digest data-sketching spark scala spark-ml pyspark dataset udaf python feature-importance

29 2
scalapy/python-native-libs 0.2.4

Helpers for setting up an embedded Python interpreter

Scala versions: 3.x 2.13 2.12

embedded python scala

18 3
fqaiser94/mse 0.2.4

Make Structs Easy (MSE)

Scala versions: 2.12 2.11

pyspark spark scala python struct nested

18 1
jelmerk/hnswlib-spark 1.1.3

Spark library for approximate nearest neighbors search using Hierarchical Navigable Small World graphs

Scala versions: 2.13 2.12 2.11

k-nearest-neighbours pyspark spark scala python

13 5
salmon-brain/dead-salmon-brain 0.0.8

Apache Spark based framework for analysis A/B experiments

Scala versions: 2.12

experiments apache-spark experimentation statistics abtesting ab-testing java spark scala split-testing python analytics

15 2
ozancicek/artan 0.5.1

Online latent state estimation with Spark

Scala versions: 2.12

kalman-filter streaming spark-structured-streaming sparkml pyspark spark python scala finite-mixture

5 1
timvw/adobe-analytics-datafeed-datasource 0.1.0

Apache Spark data source for Adobe Analytics Data Feed

Scala versions: 2.12

adobe-analytics spark scala python clickstream

3 2