DataFrameGroupBy#

class pandas::DataFrameGroupBy#: GroupBy class for split-apply-combine operations.

Example#

#include <pandas/pandas.h>
using namespace pandas;

// Use DataFrameGroupBy
DataFrameGroupBy obj;
// ... operations ...

Constructors#

Signature	Location	Example
`DataFrameGroupBy(const DataFrame& df, const std::vector<std::string>& by, bool as_index = true, bool sort = true, bool dropna = true, bool observed = true, bool group_keys = true)`	pd_groupby.h:100
`DataFrameGroupBy(const DataFrame& df, const std::string& by, bool as_index = true, bool sort = true, bool dropna = true, bool observed = true, bool group_keys = true)`	pd_groupby.h:111

Indexing / Selection#

Signature	Return Type	Location	Example
`DataFrame first() const`	DataFrame	pd_groupby.h:301	View
`std::optional<std::string> first_by_index_name_() const`	std::optional<std::string>	pd_groupby.h:90
`DataFrame get_group(const std::string& key) const`	DataFrame	pd_groupby.h:323	View
`DataFrame get_group(const std::string& key, const std::set<std::string>& exclude_cols) const`	DataFrame	pd_groupby.h:331	View
`std::vector<std::string> get_numeric_value_columns() const`	std::vector<std::string>	pd_groupby.h:447	View
`std::vector<std::string> get_value_columns(const std::string& agg_name = "") const`	std::vector<std::string>	pd_groupby.h:453
`DataFrame head(int n = 5) const`	DataFrame	pd_groupby.h:313	View
`DataFrame idxmax(bool numeric_only = false) const`	DataFrame	pd_groupby.h:465	View
`DataFrame idxmin(bool numeric_only = false) const`	DataFrame	pd_groupby.h:466	View
`DataFrame idxmin_with_dtype(bool numeric_only = false) const`	DataFrame	pd_groupby.h:263	View
`DataFrame last() const`	DataFrame	pd_groupby.h:304	View
`DataFrame tail(int n = 5) const`	DataFrame	pd_groupby.h:316	View

Data Manipulation#

Signature	Return Type	Location	Example
`bool dropna() const`	bool	pd_groupby.h:407	View

Statistics#

Signature	Return Type	Location	Example
`DataFrame count() const`	DataFrame	pd_groupby.h:166	View
`DataFrame describe() const`	DataFrame	pd_groupby.h:171	View
`DataFrame max(bool numeric_only = false) const`	DataFrame	pd_groupby.h:163	View
`DataFrame mean(bool numeric_only = false) const`	DataFrame	pd_groupby.h:161	View
`DataFrame median(bool numeric_only = false) const`	DataFrame	pd_groupby.h:167	View
`DataFrame min(bool numeric_only = false) const`	DataFrame	pd_groupby.h:162	View
`DataFrame nunique(bool dropna = true) const`	DataFrame	pd_groupby.h:170	View
`DataFrame prod(bool numeric_only = false) const`	DataFrame	pd_groupby.h:168	View
`DataFrame sem(int ddof = 1, bool numeric_only = false) const`	DataFrame	pd_groupby.h:169	View
`DataFrame std_(int ddof = 1, bool numeric_only = false) const`	DataFrame	pd_groupby.h:164	View
`DataFrame sum(bool numeric_only = false) const`	DataFrame	pd_groupby.h:160	View
`DataFrame var(int ddof = 1, bool numeric_only = false) const`	DataFrame	pd_groupby.h:165	View

Aggregation#

Signature	Return Type	Location	Example
`DataFrame agg(const std::string& func_name) const`	DataFrame	pd_groupby.h:177	View
`DataFrame agg(const std::vector<std::string>& funcs) const`	DataFrame	pd_groupby.h:183	View
`DataFrame agg(const std::vector<std::pair<std::string, std::vector<std::string>>>& col_funcs) const`	DataFrame	pd_groupby.h:193	View
`DataFrame agg(const std::map<std::string, std::string>& col_func_map) const`	DataFrame	pd_groupby.h:204	View
`DataFrame agg(std::initializer_list<std::pair<std::string, std::vector<std::string>>> col_funcs_init) const`	DataFrame	pd_groupby.h:234	View
`PANDASCORE_API Result agg(const FuncArg& func) const`	PANDASCORE_API Result	pd_groupby.h:352	View
`DataFrame agg_callable_with_dtype( const std::function<pandas::ApplyCellResult( const pandas::Series<numpy::float64>&)>& cb) const`	DataFrame	pd_groupby.h:257	View
`DataFrame agg_impl( const std::vector<std::pair<std::string, std::vector<std::string>>>& col_funcs, bool list_form) const`	DataFrame	pd_groupby.h:500
`DataFrame agg_named(const std::vector<NamedAggSpec>& specs) const`	DataFrame	pd_groupby.h:339	View
`DataFrame agg_with_dtype(const std::string& how) const`	DataFrame	pd_groupby.h:248	View
`DataFrame agg_with_dtype_list(const std::vector<std::string>& funcs) const`	DataFrame	pd_groupby.h:252	View
`std::vector<double> aggregate_column(size_t col_idx, const std::string& func) const`	std::vector<double>	pd_groupby.h:621
`DataFrame apply(std::function<DataFrame(const DataFrame&)> fn, bool include_groups = true) const`	DataFrame	pd_groupby.h:282	View
`Series<numpy::float64> apply_collect_scalar_results( const std::vector<std::string>& keys, const std::vector<double>& values) const`	Series<numpy::float64>	pd_groupby.h:526	View
`Series<std::string> apply_collect_scalar_string_results( const std::vector<std::string>& keys, const std::vector<std::string>& values) const`	Series<std::string>	pd_groupby.h:536
`DataFrame apply_collect_series_results( const std::vector<std::string>& keys, const std::vector<std::string>& col_names, const std::map<std::string, std::vector<double>>& num_cols, const std::map<std::string, std::vector<std::string>>& str_cols, const std::string& columns_axis_name = "") const`	DataFrame	pd_groupby.h:549	View
`DataFrame apply_concat_dataframe_results( const std::vector<std::string>& keys, const std::vector<DataFrame>& dfs, bool use_group_keys) const`	DataFrame	pd_groupby.h:563	View
`void apply_int_dtype_if_needed(DataFrame& result, const std::string& result_col, const std::string& source_col, const std::string& func) const`	void	pd_groupby.h:636
`DataFrameGroupByResampler resample(const std::string& rule, const std::string& closed = "left", const std::string& label = "left") const`	DataFrameGroupByResampler	pd_groupby.h:512	View
`DataFrame transform_apply_numeric( std::function<std::vector<double>(const std::string&, const Series<numpy::float64>&)> fn) const`	DataFrame	pd_groupby.h:473
`DataFrame transform_concat_results( const std::map<std::string, std::vector<double>>& col_data, const std::vector<std::string>& value_cols) const`	DataFrame	pd_groupby.h:584
`DataFrame transform_named(const std::string& func_name) const`	DataFrame	pd_groupby.h:593	View

Reshaping#

Signature	Return Type	Location	Example
`squeeze_result(DataFrame& result) const`		pd_groupby.h:441	View

Other Methods#

Signature	Return Type	Location	Example
`bool as_index() const`	bool	pd_groupby.h:398
`void build_groups()`	void	pd_groupby.h:617
`std::vector<std::string> by_column_dtypes() const`	std::vector<std::string>	pd_groupby.h:388
`const std::vector<std::string>& by_columns() const`	const std::vector<std::string>&	pd_groupby.h:385
`std::vector<std::pair<std::string, std::vector<std::string>>> col_funcs( col_funcs_init.begin(), col_funcs_init.end())`	std::vector<std::pair<std::string, std::vector<std::string>>>	pd_groupby.h:235
`DataFrameGroupByColumn<T> column(const std::string& col_name) const`	DataFrameGroupByColumn<T>	pd_groupby.h:292	View
`static double compute_agg(const std::vector<double>& values, const std::string& func, int ddof = 1)`	static double	pd_groupby.h:624	View
`const DataFrame& dataframe() const`	const DataFrame&	pd_groupby.h:382	View
`DataFrame filter(std::function<bool(const DataFrame&)> predicate) const`	DataFrame	pd_groupby.h:274	View
`DataFrame filter_by_group_mask( const std::map<std::string, bool>& group_mask, bool use_dropna = true) const`	DataFrame	pd_groupby.h:574	View
`bool group_keys() const`	bool	pd_groupby.h:404
`const std::vector<std::string>& group_keys_order() const`	const std::vector<std::string>&	pd_groupby.h:377	View
`const std::unordered_map<std::string, std::vector<size_t>>& groups() const`	const std::unordered_map<std::string, std::vector<size_t>>&	pd_groupby.h:372	View
`DataFrame idx_extreme_impl_(int which, bool numeric_only) const`	DataFrame	pd_groupby.h:492
`bool list_selected() const`	bool	pd_groupby.h:413	View
`std::string make_group_key(size_t row_idx) const`	std::string	pd_groupby.h:618
`Series<int64_t> ngroup(bool ascending = true) const`	Series<int64_t>	pd_groupby.h:359
`size_t ngroups() const { return group_keys_order_.size()`	size_t	pd_groupby.h:369	View
`DataFrame nth(int n) const`	DataFrame	pd_groupby.h:310	View
`DataFrame nth(const std::vector<int>& positions, const std::string& dropna_mode = "") const`	DataFrame	pd_groupby.h:613	View
`DataFrame nth_by_resolved_slices( const std::vector<std::vector<ResolvedSlice>>& per_group_slices) const`	DataFrame	pd_groupby.h:488
`void rebuild_groups_with_empty_seeds(std::vector<std::string> keys)`	void	pd_groupby.h:151
`DataFrameGroupBy select(const std::vector<std::string>& columns) const`	DataFrameGroupBy	pd_groupby.h:421	View
`DataFrameGroupBy select_as_list(const std::vector<std::string>& columns) const`	DataFrameGroupBy	pd_groupby.h:429	View
`DataFrame select_rows_by_indices( const std::vector<size_t>& row_indices, const std::vector<std::string>& columns = {}, bool exclude_internal = false) const`	DataFrame	pd_groupby.h:602	View
`const std::vector<std::string>& selected_columns() const`	const std::vector<std::string>&	pd_groupby.h:410	View
`void set_extra_empty_keys(std::vector<std::string> keys)`	void	pd_groupby.h:141
`void set_owned_df(std::shared_ptr<DataFrame> df)`	void	pd_groupby.h:123
`void set_result_index(DataFrame& result) const`	void	pd_groupby.h:627
`void set_synthetic_freq_key(bool value)`	void	pd_groupby.h:133
`bool should_squeeze_to_series() const`	bool	pd_groupby.h:416	View
`Series<int64_t> size() const`	Series<int64_t>	pd_groupby.h:366	View
`bool sort_flag() const`	bool	pd_groupby.h:401

Code Examples#

The following examples are extracted from the test suite.