gds.datasets.pyg_sbm_isolation_dataset

gds/datasets/pyg_sbm_isolation_dataset.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62	import os import os.path as osp import torch from torch_geometric.data import InMemoryDataset, download_url, extract_zip, Data from typing import Optional, Callable, List class PyGSBMIsolationDataset(InMemoryDataset): names = ['SBM-Isolation'] urls = { 'SBM-Isolation': 'https://www.dropbox.com/s/sz1auhmsoevntli/SBM-Isolation.zip?dl=1' } def __init__(self, root: str, name: str, transform: Optional[Callable] = None, pre_transform: Optional[Callable] = None, pre_filter: Optional[Callable] = None): self.name = name assert self.name in self.names if name == 'SBM-Isolation': self.num_tasks = 1 self.__num_classes__ = 4 else: raise NotImplementedError super().__init__(root, transform, pre_transform, pre_filter) self.data, self.slices = torch.load(self.processed_paths[0]) @property def raw_dir(self) -> str: return osp.join(self.root, self.name, 'raw') @property def processed_dir(self) -> str: return osp.join(self.root, self.name, 'processed') @property def raw_file_names(self) -> List[str]: # raw file name must match the dataset name return [f'{self.name}.pt'] @property def processed_file_names(self) -> List[str]: return [f'{self.name}_processed.pt'] def download(self): path = download_url(self.urls[self.name], self.raw_dir) extract_zip(path, self.raw_dir) os.unlink(path) def process(self): inputs = torch.load(self.raw_paths[0]) data_list = [Data(**data_dict) for data_dict in inputs] if self.pre_filter is not None: data_list = [d for d in data_list if self.pre_filter(d)] if self.pre_transform is not None: data_list = [self.pre_transform(d) for d in data_list] torch.save(self.collate(data_list), self.processed_paths[0])

gds/datasets/pyg_sbm_isolation_dataset.py

import os
import os.path as osp
import torch
from torch_geometric.data import InMemoryDataset, download_url, extract_zip, Data
from typing import Optional, Callable, List


class PyGSBMIsolationDataset(InMemoryDataset):
    names = ['SBM-Isolation']
    urls = {
        'SBM-Isolation': 'https://www.dropbox.com/s/sz1auhmsoevntli/SBM-Isolation.zip?dl=1'
    }

    def __init__(self, root: str, name: str,
                 transform: Optional[Callable] = None,
                 pre_transform: Optional[Callable] = None,
                 pre_filter: Optional[Callable] = None):
        self.name = name
        assert self.name in self.names
        if name == 'SBM-Isolation':
            self.num_tasks = 1
            self.__num_classes__ = 4
        else:
            raise NotImplementedError

        super().__init__(root, transform, pre_transform, pre_filter)
        self.data, self.slices = torch.load(self.processed_paths[0])

    @property
    def raw_dir(self) -> str:
        return osp.join(self.root, self.name, 'raw')

    @property
    def processed_dir(self) -> str:
        return osp.join(self.root, self.name, 'processed')

    @property
    def raw_file_names(self) -> List[str]:
        # raw file name must match the dataset name
        return [f'{self.name}.pt']

    @property
    def processed_file_names(self) -> List[str]:
        return [f'{self.name}_processed.pt']

    def download(self):
        path = download_url(self.urls[self.name], self.raw_dir)
        extract_zip(path, self.raw_dir)
        os.unlink(path)

    def process(self):
        inputs = torch.load(self.raw_paths[0])

        data_list = [Data(**data_dict) for data_dict in inputs]

        if self.pre_filter is not None:
            data_list = [d for d in data_list if self.pre_filter(d)]

        if self.pre_transform is not None:
            data_list = [self.pre_transform(d) for d in data_list]

        torch.save(self.collate(data_list), self.processed_paths[0])